行间公式索引

📜 原文
📖 逐步解释
∑ 公式拆解
💡 数值示例
⚠️ 易错点
📝 总结
🎯 存在目的
🧠 直觉心智模型
💭 直观想象

11 基础知识

1.1.1 集合论基础

[原文]

读者应该熟悉集合论的基础知识:集合、$\cap, \cup, \in$ 等。我们对给定集合 $A$ 的子集的表示法如下:

$$ B=\{a \in A \mid \ldots(\text { 对 } a \text { 的条件 }) \ldots\} 。 $$

集合 $A$ 的基数将用 $|A|$ 表示。如果 $A$ 是一个有限集合,则 $A$ 的就是 $A$ 中元素的数量。

理解如何测试特定的 $x \in A$ 是否位于 $A$ 的子集 $B$ 中(参见练习 1-4)非常重要。两个集合 $A$ 和 $B$ 的笛卡尔积有序对集合 $A \times B=\{(a, b) \mid a \in A, b \in B\}$,其中元素来自 $A$ 和 $B$。

[逐步解释]

这段话介绍了最基础的集合论概念和符号。

1. 基本概念

* 集合 (Set):一堆确定的、互不相同的对象的总体。例如,所有正整数构成一个集合。

* 元素 (Element):集合中的每个对象。例如,数字 3 是正整数集合的一个元素。

* 符号 $\in$:表示“属于”。$a \in A$ 读作“a 属于 A”,意思是 a 是集合 A 的一个元素。

* 符号 $\cap$:表示“交集”。$A \cap B$ 是一个新的集合,其元素既属于 A 也属于 B。

* 符号 $\cup$:表示“并集”。$A \cup B$ 是一个新的集合,其元素或者属于 A,或者属于 B,或者两者都属于。

2. 子集的表示法 (Set-builder notation)

* 这是一种用“规则”来描述集合的方法,而不是把所有元素都列出来。

* 格式是 {变量 | 条件} 或者 {变量 : 条件}

* 原文的 $B=\{a \in A \mid \ldots(\text { 对 } a \text { 的条件 }) \ldots\}$ 意思就是:子集 B 是由集合 A 中所有满足特定条件的元素 a 组成的。

3. 集合的阶/基数 (Order/Cardinality)

* 用符号 $|A|$ 表示。

* 对于有限集合(元素个数是有限的),$|A|$ 就是元素的个数。

* 对于无限集合,阶/基数的概念更复杂,涉及到无穷大的“大小”比较,但在初等阶段,我们主要关心有限集合的阶。

4. 测试元素是否在子集中

* 要判断一个元素 $x$ 是否在子集 $B=\{a \in A \mid \text{条件}\}$ 中,你需要做两步检查:

1. 检查 $x$ 是否在父集 $A$ 中,即 $x \in A$ 是否成立。

2. 如果成立,再检查 $x$ 是否满足定义子集 B 的那个“条件”。

* 只有两步都通过,才能说 $x \in B$。

5. 笛卡尔积 (Cartesian Product)

* 用符号 $A \times B$ 表示。

* 它产生的新集合的元素是有序对 (ordered pair),形如 $(a, b)$。

* 有序意味着 $(a, b)$ 和 $(b, a)$ 是不同的(除非 $a=b$ 且 $A=B$)。第一个元素必须来自集合 A,第二个元素必须来自集合 B。

[公式与符号逐项拆解和推导(若本段含公式)]

$$ B=\{a \in A \mid \ldots(\text { 对 } a \text { 的条件 }) \ldots\} $$

- $B$: 这是我们正在定义的新集合,即子集。

- $=$: 定义符号,表示左边等于右边。

- $\{$ ... $\}$: 集合的括号,里面包含集合的描述。

- $a$: 一个代号,代表集合中的一个典型的元素。你可以用任何字母,比如 $x, y$ 等。

- $\in$: “属于”符号。$a \in A$ 表示元素 $a$ 必须来自集合 $A$。

- $\mid$: “满足...条件”的分隔符,读作 "such that" 或“使得”。有些书也用冒号 :

- $\ldots(\text { 对 } a \text { 的条件 }) \ldots$: 这是一个占位符,代表一个逻辑判断语句。对于任何一个来自 $A$ 的元素 $a$,我们将这个判断语句应用到它身上,如果结果为真,那么这个 $a$ 就被包含在集合 $B$ 中;如果为假,就不包含。

[具体数值示例(至少1个,建议≥2个)]

示例1:子集表示法

- 设父集 $A = \{1, 2, 3, 4, 5, 6\}$。

- 我们想定义一个子集 $B$,它包含 $A$ 中所有的偶数。

- 这里的“条件”就是“是一个偶数”。

- 使用集合构建表示法,我们写作:$B = \{ a \in A \mid a \text{ 是偶数} \}$。

- 为了验证这个定义,我们检查 A 中的每个元素:

- 1 是偶数吗?否。

- 2 是偶数吗?是。所以 $2 \in B$。

- 3 是偶数吗?否。

- 4 是偶数吗?是。所以 $4 \in B$。

- 5 是偶数吗?否。

- 6 是偶数吗?是。所以 $6 \in B$。

- 因此, $B = \{2, 4, 6\}$。

- 这个集合 $B$ 的是 $|B| = 3$。

示例2:笛卡尔积

- 设集合 $A = \{1, 2\}$ 和集合 $B = \{\text{红}, \text{黄}\}$。

- 它们的笛卡尔积 $A \times B$ 是所有可能的有序对 $(a, b)$ 的集合,其中 $a$ 来自 $A$,$b$ 来自 $B$。

- $A \times B = \{ (1, \text{红}), (1, \text{黄}), (2, \text{红}), (2, \text{黄}) \}$。

- 注意顺序很重要,$B \times A = \{ (\text{红}, 1), (\text{红}, 2), (\text{黄}, 1), (\text{黄}, 2) \}$。

- 可以看到 $A \times B \neq B \times A$。

- 笛卡尔积的阶等于各集合阶的乘积:$|A \times B| = |A| \times |B| = 2 \times 2 = 4$。

[易错点与边界情况]

- 子集表示法的误解:$B=\{a \in A \mid \text{条件}\}$ 中的 $a$ 只是一个占位符,它本身没有特殊含义。$B=\{x \in A \mid x \text{ 是偶数}\}$ 和 $B=\{y \in A \mid y \text{ 是偶数}\}$ 定义的是完全相同的集合。

- 阶 vs. 元素:集合的阶 $|A|$ 是一个数字,而集合 $A$ 本身是一堆对象的聚集。不要混淆。例如,如果 $A = \{7, 8\}$,那么 $|A| = 2$,但 $2 \notin A$。

- 空集:空集 $\emptyset = \{\}$ 是任何集合的子集。它的阶是 $|\emptyset| = 0$。

- 笛卡尔积的顺序:初学者很容易忘记笛卡尔积 $A \times B$ 中的元素是有序对,从而错误地认为 $A \times B$ 和 $B \times A$ 是一样的。它们通常是不一样的。

- 元素 vs. 单元素集合:$a$ 是一个元素,而 $\{a\}$ 是一个只包含一个元素的集合。它们是不同类型的对象。$a \in A$,但 $\{a\} \subseteq A$($\{a\}$ 是 $A$ 的子集)。

[总结]

本节回顾了集合论的基石:如何用特定规则(集合构建范式)从一个大集合中筛选元素来构建一个子集,如何计算有限集合中元素的数量(阶),以及如何通过组合两个集合的元素来创建有序对的集合(笛卡尔积)。

[存在目的]

集合是数学的通用语言。抽象代数研究的是带有某些运算结构的集合(如群、环、域)。因此,在讨论这些结构之前,必须先统一关于集合本身的基本术语、符号和操作,以确保后续的定义和证明建立在坚实且无歧义的基础之上。

[直觉心智模型]

- 集合:一个袋子。

- 元素:袋子里的物品。

- 子集:从大袋子里按照某个标准(比如“只挑出红色的球”)挑出一部分物品,放进一个小袋子里。

- :袋子里有多少个物品。

- 笛卡尔积 $A \times B$:想象你有两套衣服,上衣集合 $A=\{\text{T恤}, \text{衬衫}\}$,裤子集合 $B=\{\text{牛仔裤}, \text{休闲裤}\}$。$A \times B$ 就是所有可能的上下装搭配方案的集合,每种方案都是一个有序对,比如 (T恤, 牛仔裤)。


1.1.2 常用数集

[原文]

我们将使用以下符号表示一些常见的数集

(1) $\mathbb{Z}=\{0, \pm 1, \pm 2, \pm 3, \ldots\}$ 表示整数($\mathbb{Z}$ 是德语“数字”:”Zahlen”的缩写)。

(2) $\mathbb{Q}=\{a / b \mid a, b \in \mathbb{Z}, b \neq 0\}$ 表示有理数(或有理数集)。

(3) $\mathbb{R}=\left\{\right.$ 所有小数展开式 $\left.\pm d_{1} d_{2} \ldots d_{n} . a_{1} a_{2} a_{3} \ldots\right\}$ 表示实数(或实数集)。

(4) $\mathbb{C}=\left\{a+b i \mid a, b \in \mathbb{R}, i^{2}=-1\right\}$ 表示复数

(5) $\mathbb{Z}^{+}、\mathbb{Q}^{+}$和 $\mathbb{R}^{+}$将分别表示 $\mathbb{Z}、\mathbb{Q}$ 和 $\mathbb{R}$ 中的(非零)元素。

[逐步解释]

这部分定义了在整本书中会反复使用的标准数集符号。

1. $\mathbb{Z}$ (整数集)

* 包括所有正整数、负整数和零。

* ... 表示无限延伸。

* 字母 Z 来自德语单词 "Zahlen",意思是“数字”。

2. $\mathbb{Q}$ (有理数集)

* 所有可以表示成两个整数之比(分数)的数。

* 定义 $a/b$ 中,$a$ 是分子,$b$ 是分母。

* 一个至关重要的条件是分母 $b$ 不能为零 ($b \neq 0$),因为除以零在数学上没有定义。

* 字母 Q 来自英语单词 "Quotient",意思是“商”。

3. $\mathbb{R}$ (实数集)

* 这包括了有理数和无理数(比如 $\pi, \sqrt{2}$)。

* 原文用“所有小数展开式”来描述,这是一种直观的说法。实数可以与数轴上的点一一对应。

* 小数展开可以是有限的(如 0.5),无限循环的(如 $1/3 = 0.333...$),或无限不循环的(如 $\pi = 3.14159...$)。

4. $\mathbb{C}$ (复数集)

* 复数扩展了实数。它的形式是 $a+bi$。

* $a$ 是实部,来自实数集 $\mathbb{R}$。

* $b$ 是虚部,也来自实数集 $\mathbb{R}$。

* $i$ 是虚数单位,其定义是 $i^2 = -1$。这使得我们可以处理负数的平方根。

5. 正数集符号

* 右上角的 + 号表示取该集合中的正数部分。

* $\mathbb{Z}^{+}$ 是正整数集 $\{1, 2, 3, \ldots\}$。注意,根据上下文,有时可能包含0,但这里原文明确指出是“非零”元素,所以不包含0。在本书中,正数就是大于0的数。

* $\mathbb{Q}^{+}$ 是所有正有理数。

* $\mathbb{R}^{+}$ 是所有正实数。

[具体数值示例(至少1个,建议≥2个)]

- 整数 $\mathbb{Z}$: $-100, -2, 0, 5, 42$ 都是整数。

- 有理数 $\mathbb{Q}$:

- $1/2$ 是有理数 ($a=1, b=2$)。

- $-7/3$ 是有理数 ($a=-7, b=3$)。

- $5$ 也是有理数,因为它可以写成 $5/1$ ($a=5, b=1$)。这说明所有整数都是有理数。

- $0.25$ 也是有理数,因为它可以写成 $1/4$。

- 实数 $\mathbb{R}$:

- 以上所有的整数和有理数都是实数。

- $\sqrt{2} \approx 1.41421356...$ 是实数,但它不是有理数(即它是无理数)。

- $\pi \approx 3.14159265...$ 是实数,但它不是有理数(即它是无理数)。

- 复数 $\mathbb{C}$:

- $3 + 2i$ 是一个复数,实部是3,虚部是2。

- $5i$ (或 $0+5i$) 是一个纯虚数,实部是0,虚部是5。

- $7$ (或 $7+0i$) 是一个实数,但也可以看作一个复数,其虚部为0。这说明所有实数都是复数。

- 正数集:

- $\mathbb{Z}^{+} = \{1, 2, 3, \ldots\}$。

- $5 \in \mathbb{Z}^{+}$。

- $1/2 \in \mathbb{Q}^{+}$。

- $\pi \in \mathbb{R}^{+}$。

- $-3 \notin \mathbb{Z}^{+}$。

- $0 \notin \mathbb{Z}^{+}$。

[易错点与边界情况]

- 集合的包含关系:$\mathbb{Z} \subset \mathbb{Q} \subset \mathbb{R} \subset \mathbb{C}$。也就是说,所有整数都是有理数,所有有理数都是实数,所有实数都是复数。这是一个层层嵌套的结构。

- 0是否为正数:在本书的约定中,带 + 号的集合 $\mathbb{Z}^{+}, \mathbb{Q}^{+}, \mathbb{R}^{+}$ 不包含 0。但在其他一些数学文献中,对“自然数”的定义有时会包含0。因此,注意当前上下文的约定非常重要。

- 有理数的表示:一个有理数有多种分数表示,例如 $1/2 = 2/4 = -3/-6$。定义 $f(a/b)=a$ 是有问题的(“非良定义的”),因为它依赖于分数的特定写法。

[总结]

本节规定了五种基本数集(整数、有理数、实数、复数)和它们的正子集的标准符号。这些符号是数学界的通用语言,将在后续所有章节中不加解释地直接使用。

[存在目的]

为了避免每次提到整数或实数时都要用文字冗长地描述,使用标准符号 $\mathbb{Z}, \mathbb{R}$ 等可以让表达更简洁、精确、无歧义。这是一种效率和严谨性的体现。

[直观想象]

- $\mathbb{Z}$ (整数):数轴上孤立的点,像一串等距的珠子。

- $\mathbb{Q}$ (有理数):在数轴上极为密集,任何两个有理数之间都有无穷多个有理数。但它们仍然有“缝隙”。

- $\mathbb{R}$ (实数):填满了数轴上所有的点,是一条连续不断的线,没有任何缝隙。

- $\mathbb{C}$ (复数):不再是一条线,而是一个平面(复平面)。实轴(横轴)代表实部,虚轴(纵轴)代表虚部。每个复数是平面上的一个点。


1.1.3 函数 (映射)

1.1.3.1 定义与符号
[原文]

我们将使用符号 $f: A \rightarrow B$ 或 $A \xrightarrow{f} B$ 来表示从 $A$ 到 $B$ 的函数 $f$,并且 $f$ 在 $a$ 处的值表示为 $f(a)$(即,我们将所有函数应用到左侧)。函数映射这两个词我们可互换使用。集合 $A$ 称为 $f$ 的定义域,而 $B$ 称为 $f$ 的上域。如果 $f$ 是已知的,则符号 $f: a \mapsto b$ 或 $a \mapsto b$ 表示 $f(a)=b$,即函数在元素上被指定。

[逐步解释]

这部分引入了函数的基本概念和符号。

1. 函数 (Function) / 映射 (Mapping):在本书中,这两个词是同义词。一个函数 $f$ 是一个规则,它将定义域集合 $A$ 中的每一个元素,都对应到上域集合 $B$ 中一个唯一的元素。

2. 函数符号 $f: A \rightarrow B$

* $f$:函数的名字。

* $A$:定义域 (Domain),即函数输入的来源集合。

* $B$:上域 (Codomain),即函数输出可能存在的目标集合。

* $\rightarrow$:箭头表示从定义域到上域的映射方向。

3. 函数求值 $f(a)$

* $a$ 是定义域 $A$ 中的一个具体元素。

* $f(a)$ 是 $a$ 在函数 $f$ 的作用下,对应到上域 $B$ 中的那个唯一的元素。这个元素被称为 $a$ 的像 (image)

* “我们将所有函数应用到左侧” 指的是 $f(a)$ 这种标准写法,函数名 $f$ 在其作用的元素 $a$ 的左边。

4. 元素映射符号 $a \mapsto b$

* 这个带小竖线的箭头 $\mapsto$ 表示一个具体的元素对应关系。

* $a \mapsto b$ 读作 "a is mapped to b",明确指出函数 $f$ 把元素 $a$ 变成了元素 $b$,即 $f(a)=b$。

* 这与 $\rightarrow$ 不同,$\rightarrow$ 描述的是集合之间的关系,而 $\mapsto$ 描述的是元素之间的关系。

[具体数值示例(至少1个,建议≥2个)]

示例1:平方函数

- 设函数 $f$ 的功能是“求一个数的平方”。

- 我们可以定义它为从实数到实数的函数:$f: \mathbb{R} \rightarrow \mathbb{R}$。

- 这里的定义域是 $\mathbb{R}$,上域也是 $\mathbb{R}$。

- 对于定义域中的一个元素,比如 $3$,它的值是 $f(3) = 3^2 = 9$。

- 我们可以用元素映射符号来表示这个具体关系:$3 \mapsto 9$。

- 同样,$-2 \mapsto 4$。

示例2:颜色指派函数

- 设 $A = \{\text{苹果}, \text{香蕉}, \text{草莓}\}$, $B = \{\text{红色}, \text{黄色}, \text{绿色}\}$。

- 我们定义一个函数 $g: A \rightarrow B$,它描述这些水果的典型颜色。

- $g(\text{苹果}) = \text{红色}$

- $g(\text{香蕉}) = \text{黄色}$

- $g(\text{草莓}) = \text{红色}$

- 用元素映射符号表示:

- 苹果 $\mapsto$ 红色

- 香蕉 $\mapsto$ 黄色

- 草莓 $\mapsto$ 红色

- 定义域是 $A$,上域是 $B$。

[易错点与边界情况]

- 定义域中的“每一个”:函数必须对定义域中的所有元素都有定义。例如, $f: \mathbb{R} \rightarrow \mathbb{R}$ 定义为 $f(x)=1/x$ 不是一个合法的函数,因为 $x=0$ 时没有定义。为了合法,必须将定义域修改为 $\mathbb{R} \setminus \{0\}$。

- 上域中的“唯一”:定义域中的一个元素不能对应到上域中的多个元素。例如,"取一个数的平方根" $f(x)=\pm\sqrt{x}$ 不是一个从 $\mathbb{R}^+$ 到 $\mathbb{R}$ 的函数,因为 $f(4)$ 既可以是 2 也可以是 -2。

- 上域 (Codomain) vs. 值域 (Range):上域是函数输出的“目标靶场”,是函数定义时就规定好的。值域是实际上所有输出值构成的集合,是上域的一个子集。在示例2中,上域是 $B = \{\text{红色}, \text{黄色}, \text{绿色}\}$,但值域是 $\{\text{红色}, \text{黄色}\}$,因为“绿色”没有被任何水果对应到。

[总结]

本节明确了函数(或映射)的定义:一种将定义域中每个元素唯一地与上域中一个元素相关联的规则。同时,它规定了描述函数整体($f: A \rightarrow B$)和描述单个元素对应关系($a \mapsto b$)的标准化符号。

[存在目的]

函数是描述两个集合之间关系的核心数学工具。在抽象代数中,我们将特别关注那些能“保持结构”的函数(称为同态),它们是理解和比较不同代数结构的关键。因此,首先必须对函数本身有一个清晰、统一的定义。

[直觉心- [直觉心智模型]

- 函数:一台机器。

- 定义域 $A$:机器能接受的原材料的集合。

- 上域 $B$:机器可能生产出的产品的种类的集合。

- 一个元素 $a \in A$:一份具体的原材料。

- $f(a)$:把原材料 $a$ 投进机器 $f$ 后,生产出的那个唯一的产品。

- $a \mapsto b$:一个操作记录,说明“投入原材料a,产出了产品b”。


1.1.3.2 函数的良定义性
[原文]

如果函数 $f$ 未在元素上指定,通常检查 $f$ 是否良好定义(well defined),即是否被明确确定,这一点很重要。例如,如果集合 $A$ 是两个子集 $A_{1}$ 和 $A_{2}$ 的并集,那么可以通过声明 $f$ 将 $A_{1}$ 中的所有内容映射到 0,并将 $A_{2}$ 中的所有内容映射到 1,来尝试指定一个从 $A$ 到集合 $\{0,1\}$ 的函数。除非 $A_{1}$ 和 $A_{2}$ 有共同的元素(在这种情况下,不清楚这些元素应该映射到 0 还是 1),否则这会明确定义 $f$。因此,检查这个 $f$ 是否良好定义,就相当于检查 $A_{1}$ 和 $A_{2}$ 没有交集

[逐步解释]

这部分讨论了一个在定义函数时至关重要的概念:良定义性 (Well-definedness)

一个函数是“良定义的”,意味着它的定义是清晰、无歧义的。对于定义域中的任何一个输入,都必须有且仅有一个确定的输出。

当函数的定义是基于输入的某种“表示”或“属性”,而不是输入本身时,良定义性问题就显得尤为突出。

原文的例子说明了这一点:

1. 尝试定义函数:我们想定义一个函数 $f: A_1 \cup A_2 \rightarrow \{0, 1\}$。

2. 定义规则

- 如果一个元素 $x$ 在 $A_1$ 里,就让 $f(x)=0$。

- 如果一个元素 $x$ 在 $A_2$ 里,就让 $f(x)=1$。

3. 潜在的问题:如果有一个元素 $x$ 同时在 $A_1$ 和 $A_2$ 中(即 $x \in A_1 \cap A_2$),那么按照第一条规则,$f(x)$ 应该是 0;但按照第二条规则,$f(x)$ 又应该是 1。由于一个输入不能有两个输出,这就产生了歧义。函数 $f$ 在这种情况下就不是“良定义的”。

4. 良定义的条件:为了让这个 $f$ 的定义没有歧义,必须保证任何元素不会同时满足两条规则。这意味着 $A_1$ 和 $A_2$ 的交集必须是空的,即 $A_1 \cap A_2 = \emptyset$。此时,对于任何元素 $x \in A_1 \cup A_2$,它要么只在 $A_1$ 中,要么只在 $A_2$ 中,输出是唯一确定的。

[具体数值示例(至少1个,建议≥2个)]

示例1:有理数上的函数(非良定义)

- 我们在练习5(a)中见过这个例子。尝试定义一个函数 $f: \mathbb{Q} \rightarrow \mathbb{Z}$,规则是 $f(a/b) = a$。

- 问题:有理数 $1/2$ 和 $2/4$ 是同一个数。

- 按照规则,对于 $1/2$ 这种表示,$f(1/2) = 1$。

- 按照规则,对于 $2/4$ 这种表示,$f(2/4) = 2$。

- 我们有同一个输入(有理数 $0.5$),但是根据其不同的分数“表示”,得到了两个不同的输出(1 和 2)。

- 因此,这个函数 $f$ 不是良定义的。

示例2:有理数上的函数(良定义)

- 我们在练习5(b)中见过这个例子。尝试定义一个函数 $g: \mathbb{Q} \rightarrow \mathbb{Q}$,规则是 $g(a/b) = a^2/b^2$。

- 检查:我们还是用同一个数,不同的表示:$1/2$ 和 $2/4$。

- 对于 $1/2$ 这种表示,$g(1/2) = 1^2/2^2 = 1/4$。

- 对于 $2/4$ 这种表示,$g(2/4) = 2^2/4^2 = 4/16$。

- 因为 $1/4$ 和 $4/16$ 是同一个有理数,所以输出是相同的。

- 我们可以推广:如果 $a/b = c/d$,那么 $ad=bc$。我们需要检查 $a^2/b^2$ 是否等于 $c^2/d^2$,即 $a^2d^2$ 是否等于 $b^2c^2$。这等价于 $(ad)^2 = (bc)^2$,因为 $ad=bc$,所以这是成立的。

- 因此,这个函数 $g$ 的输出与输入的表示方式无关,它是良定义的。

[易错点与边界情况]

- 良定义性问题通常出现在定义域的元素有多种表示方式时,比如有理数(分数表示)、模算术中的同余类、或由某些等价关系定义的商集。

- 检验良定义性的核心是证明:如果两个表示 $x_1$ 和 $x_2$ 代表的是同一个元素,那么必须有 $f(x_1) = f(x_2)$。

- 初学者在自己构造函数时,尤其是在处理商集(quotient sets)时,常常会忽略检查良定义性,这是一个非常普遍且严重的错误。

[总结]

“良定义”是函数合法性的基本门槛。它确保函数的规则是明确的,对任何给定的输入,无论这个输入如何表示或描述,其输出都是唯一确定的,没有任何模糊或矛盾之处。

[存在目的]

在抽象代数中,我们经常需要在由等价关系产生的“商集”上定义函数。例如,在整数模 $n$ 的算术中,我们是在“同余类”上定义运算。一个同余类(比如模5下的 [2])包含了无穷多个整数(..., -8, -3, 2, 7, 12, ...)。当我们定义 [a] + [b] = [a+b] 时,我们需要确保这个定义是良定义的:即我们选择 [a] 中的哪个代表元(比如2还是7),选择 [b] 中的哪个代表元,最终得到的结果都应该属于同一个同余类。因此,良定义性的检查是构造这些理论的基石。

[直觉心智模型]

想象一个自动售货机。它的输入是“按钮编号”,输出是“饮料”。

- 良定义:如果按钮 "A1" 上画的是可乐,那么每次按 "A1",出来的都必须是可乐。

- 非良定义

- 歧义:如果 "A1" 按钮同时连接到可乐和雪碧的出口,按下去会发生什么?这是不确定的。

- 依赖表示:假设有两个按钮 "A1" 和 "B2",标签上都写着“可乐”,但 "A1" 出可乐,"B2" 却出橙汁。那么“给我来一瓶‘标签上写着可乐’的饮料”这个指令就是非良定义的,因为结果依赖于你按哪个按钮(即你如何“表示”你的选择)。良定义的函数应该做到,只要你想要的是可乐,无论你通过哪个“等价的”方式表达,结果都应该是可乐。


1.1.3.3 值域与原像
[原文]

集合

$$ f(A)=\{b \in B \mid b=f(a), \text { 对于某些 } a \in A\} $$

是 $B$ 的一个子集,称为 $f$ 的值域(或 $A$ 在 $f$ 下的)。对于 $B$ 的每个子集 $C$,集合

$$ f^{-1}(C)=\{a \in A \mid f(a) \in C\} $$

由在 $f$ 下映射到 $C$ 的 $A$ 中的元素组成,称为 $C$ 在 $f$ 下的原像逆像。对于每个 $b \in B$,集合 $\{b\}$ 在 $f$ 下的原像称为 $f$ 在 $b$ 上的纤维。请注意,$f^{-1}$ 通常不是一个函数,并且 $f$ 的纤维通常包含许多元素,因为可能有许多 $A$ 中的元素映射到元素 $b$。

[逐步解释]

这部分定义了与函数输出和输入相关的两个重要集合:值域和原像。

1. 值域 (Range) / 像 (Image)

* 符号是 $f(A)$,表示整个定义域 $A$ 在函数 $f$ 作用下得到的所有输出值的集合。

* 它是上域 $B$ 的一个子集,即 $f(A) \subseteq B$。

* 值域是所有“实际命中”的目标的集合。

2. 原像 (Preimage) / 逆像 (Inverse Image)

* 符号是 $f^{-1}(C)$,其中 $C$ 是上域 $B$ 的一个子集。

* $f^{-1}(C)$ 是一个在定义域 $A$ 中的集合。它包含了所有那些被 $f$ 映射到 $C$ 集合里的元素的集合。

* 可以理解为“追溯源头”:给定一个目标区域 $C$,找出所有能射中这个区域的“出发点”。

3. 纤维 (Fiber)

* 纤维是原像的一个特例。

* 它是上域中单个元素 $b$ 的原像,即 $f^{-1}(\{b\})$。

* $f$ 在 $b$ 上的纤维,就是定义域中所有那些被 $f$ 映射到 $b$ 这一个点的元素的集合。

4. $f^{-1}$ 不是函数

* 这里要特别注意,$f^{-1}(C)$ 这个符号只是一个记号,不意味着存在一个叫做 $f^{-1}$ 的逆函数

- $f^{-1}$ 作用的对象是集合(上域的子集),返回的也是集合(定义域的子集)。

* 一个真正的逆函数应该是从元素到元素。之所以通常不存在,是因为一个 $b \in B$ 可能由多个 $a \in A$ 映射而来(此时纤维包含多个元素),也可能没有任何 $a \in A$ 映射到它(此时纤维是空集)。这都违反了函数“唯一输出”的原则。

[公式与符号逐项拆解和推导(若本段含公式)]

$$ f(A)=\{b \in B \mid b=f(a), \text { 对于某些 } a \in A\} $$

- $f(A)$: 我们要定义的集合,即函数 $f$ 的值域。

- $\{b \in B \mid ...\}$: 表示这是一个上域 $B$ 的子集,里面的元素我们用 $b$ 来代表,它需要满足 | 后面的条件。

- $b=f(a), \text { 对于某些 } a \in A$: 这就是条件。一个元素 $b$ 要想进入值域 $f(A)$,它必须能被“制造”出来,即必须存在(至少一个)定义域中的元素 $a$,使得 $f(a)$ 恰好等于 $b$。 “对于某些” (for some) 的意思是“至少存在一个”。

$$ f^{-1}(C)=\{a \in A \mid f(a) \in C\} $$

- $f^{-1}(C)$: 我们要定义的集合,即子集 $C$ 在 $f$ 下的原像。

- $\{a \in A \mid ...\}$: 表示这是一个定义域 $A$ 的子集,里面的元素我们用 $a$ 来代表,它需要满足 | 后面的条件。

- $f(a) \in C$: 这就是条件。一个元素 $a$ 要想进入原像 $f^{-1}(C)$,它经过函数 $f$ 映射后的结果 $f(a)$,必须落在目标区域 $C$ 里面。

[具体数值示例(至少1个,建议≥2个)]

继续使用之前的函数示例:$f: \mathbb{Z} \rightarrow \mathbb{Z}$ 定义为 $f(x)=x^2$。

- 定义域 $A = \mathbb{Z}$。

- 上域 $B = \mathbb{Z}$。

求值域:

- $f(\mathbb{Z})$ 是所有整数平方后得到的结果的集合。

- $f(0)=0, f(1)=1, f(-1)=1, f(2)=4, f(-2)=4, f(3)=9, ...$

- 所以值域 $f(\mathbb{Z}) = \{0, 1, 4, 9, 16, 25, \ldots\}$,即所有完全平方数。

- 可以看到,值域是上域 $\mathbb{Z}$ 的一个真子集(例如 $2, 3, -1$ 都在上域但不在值域)。

求原像:

- 设上域中的一个子集 $C = \{1, 2, 3, 4\}$。

- 求 $C$ 的原像 $f^{-1}(C)$。我们要找所有定义域中的整数 $x$,使得 $x^2$ 的结果在 $C$ 中。

- $x^2=1 \implies x=1$ 或 $x=-1$。

- $x^2=2 \implies$ 在整数中无解。

- $x^2=3 \implies$ 在整数中无解。

- $x^2=4 \implies x=2$ 或 $x=-2$。

- 所以,$f^{-1}(C) = \{-2, -1, 1, 2\}$。

求纤维:

- 求上域中元素 $9$ 的纤维 $f^{-1}(\{9\})$。我们要找所有 $x \in \mathbb{Z}$ 使得 $x^2=9$。

- 解得 $x=3$ 或 $x=-3$。

- 所以,在 9 上的纤维是集合 $\{-3, 3\}$。

- 求上域中元素 $5$ 的纤维 $f^{-1}(\{5\})$。我们要找所有 $x \in \mathbb{Z}$ 使得 $x^2=5$。

- 在整数中无解。

- 所以,在 5 上的纤维是空集 $\emptyset$。

- 求上域中元素 $0$ 的纤维 $f^{-1}(\{0\})$。我们要找所有 $x \in \mathbb{Z}$ 使得 $x^2=0$。

- 解得 $x=0$。

- 所以,在 0 上的纤维是集合 $\{0\}$。

[易错点与边界情况]

- 混淆 $f(A)$ 和 $f^{-1}(C)$ 的“居住地”:$f(A)$ 是上域 $B$ 的子集(输出端),而 $f^{-1}(C)$ 是定义域 $A$ 的子集(输入端)。

- 对 $f^{-1}$ 符号的过度解读:再次强调,$f^{-1}(C)$ 是一个符号整体,它操作的是集合。不要把它拆开看成一个叫 $f^{-1}$ 的函数作用在 $C$ 上。只有当 $f$ 是双射函数时,才存在一个从元素到元素的逆函数 $f^{-1}$。

- 原像和纤维可以是空集:如果上域的某个区域或某个点没有被任何输入映射到,那么它的原像或纤维就是空集 $\emptyset$。

[总结]

本节定义了函数的两个核心关联集合:值域(所有实际输出的集合)和原像(能产生特定输出范围的所有输入的集合)。同时,引入了纤维作为单个输出点的原像。这些概念是分析函数行为(如是否满射、是否单射)的基础。

[存在目的]

值域和原像是描述和分析函数性质的基本工具。

- 值域的大小和与上域的关系,直接决定了函数的满射性

- 纤维的大小,直接决定了函数的单射性

在抽象代数中,研究同态的核(kernel,一个特殊的原像/纤维)和像(值域)是理解代数结构之间关系的核心步骤(例如,群的第一同构定理)。

[直观想象]

继续用机器的类比 ($f: A \rightarrow B$):

- 值域 $f(A)$:这台机器实际能生产出的所有产品型号的清单。尽管它的产品目录(上域 $B$)上可能印着很多型号,但有些型号它可能根本生产不出来。

- 原像 $f^{-1}(C)$:假设 $C$ 是一个“合格产品”的规格列表。原像 $f^{-1}(C)$ 就是所有那些能够生产出合格产品的“原材料”的集合。

- 纤维 $f^{-1}(\{b\})$:假设 $b$ 是一种特定的产品“可乐”。纤维就是所有能生产出可乐的原材料的集合(可能是“配方A”、“配方B”等等)。如果纤维里有多个元素,说明有多种原材料都能生产出同一种产品。如果纤维是空集,说明这台机器根本造不出可乐。


1.1.3.4 复合函数
[原文]

如果 $f: A \rightarrow B$ 且 $g: B \rightarrow C$,则复合映射 $g \circ f: A \rightarrow C$ 定义为

$$ (g \circ f)(a)=g(f(a)) $$

[逐步解释]

这部分定义了如何将两个函数“串联”起来,形成一个新的函数。

1. 复合的条件:要将两个函数 $f$ 和 $g$ 复合成 $g \circ f$,一个关键的前提是:前一个函数 $f$ 的上域 $B$ 必须是后一个函数 $g$ 的定义域。这样才能保证 $f$ 的输出可以作为 $g$ 的输入。

* 更宽松的条件是:$f$ 的值域必须是 $g$ 的定义域的子集。但通常为了定义简洁,直接要求 $f$ 的上域就是 $g$ 的定义域。

2. 复合函数 $g \circ f$

* 这个新函数读作 "g circle f" 或 "g composed with f"。

* 它的定义域是第一个函数 $f$ 的定义域 $A$。

* 它的上域是第二个函数 $g$ 的上域 $C$。

* 所以 $g \circ f$ 是一个从 $A$ 直接到 $C$ 的函数。

3. 复合函数的运算规则

* $(g \circ f)(a)$ 的意思是,先将 $a$ 输入到函数 $f$ 中,得到结果 $f(a)$。

* 然后,再将 $f(a)$ 这个结果作为输入,送入到函数 $g$ 中,得到最终结果 $g(f(a))$。

* 注意运算顺序:虽然符号写作 $g \circ f$,但在计算时是 $f$ 先作用,然后 $g$ 再作用。顺序是从右向左。

[公式与符号逐项拆解和推导(若本段含公式)]

$$ (g \circ f)(a)=g(f(a)) $$

- $(g \circ f)$: 这是一个整体,代表复合函数这个新的函数。

- $(a)$: 表示将复合函数作用在元素 $a$ 上。

- $=$: 定义符号。

- $g(f(a))$: 这解释了复合函数的计算步骤。

- $f(a)$: 内层括号先算。将 $a$ 通过 $f$ 映射,得到一个中间结果,这个结果在集合 B 中。

- $g(...)$: 然后将这个中间结果作为 $g$ 的输入,再通过 $g$ 映射,得到最终结果,这个结果在集合 C 中。

[具体数值示例(至少1个,建议≥2个)]

示例1:代数函数复合

- 设 $f: \mathbb{R} \rightarrow \mathbb{R}$ 定义为 $f(x) = x + 3$ (加3函数)。

- 设 $g: \mathbb{R} \rightarrow \mathbb{R}$ 定义为 $g(y) = y^2$ (平方函数)。

- $f$ 的上域 $\mathbb{R}$ 是 $g$ 的定义域 $\mathbb{R}$,可以复合。

- 计算 $g \circ f$:

- 这是一个从 $\mathbb{R}$ 到 $\mathbb{R}$ 的新函数。

- $(g \circ f)(x) = g(f(x))$

- $f(x)$ 是 $x+3$,所以代入得 $g(x+3)$。

- $g$ 的作用是把输入平方,所以 $g(x+3) = (x+3)^2$。

- 因此,复合函数是 $(g \circ f)(x) = (x+3)^2 = x^2+6x+9$。

- 例如,计算 $(g \circ f)(2)$:先算 $f(2)=2+3=5$,再算 $g(5)=5^2=25$。直接用公式是 $(2+3)^2=25$。

- 计算 $f \circ g$ (注意顺序):

- 这是一个从 $\mathbb{R}$ 到 $\mathbb{R}$ 的新函数。

- $(f \circ g)(y) = f(g(y))$

- $g(y)$ 是 $y^2$,所以代入得 $f(y^2)$。

- $f$ 的作用是把输入加3,所以 $f(y^2) = y^2+3$。

- 因此,复合函数是 $(f \circ g)(y) = y^2+3$。

- 例如,计算 $(f \circ g)(2)$:先算 $g(2)=2^2=4$,再算 $f(4)=4+3=7$。直接用公式是 $2^2+3=7$。

- 结论:$(g \circ f)(x) = (x+3)^2$ 和 $(f \circ g)(x) = x^2+3$ 是完全不同的函数。这说明函数复合不满足交换律,即 $g \circ f \neq f \circ g$。

[易错点与边界情况]

- 运算顺序:最常见的错误是搞反运算顺序。$g \circ f$ 是 $f$ 先算,$g$ 后算。从右向左看。

- 复合的条件:并非任意两个函数都可以复合。必须确保第一个函数的输出类型是第二个函数可以接受的输入类型。例如,如果 $f: \mathbb{R} \rightarrow \mathbb{C}$ 且 $g: \mathbb{R} \rightarrow \mathbb{R}$,则 $g \circ f$ 就无法定义,因为 $f$ 的输出是复数,而 $g$ 只接受实数输入。

- 结合律:函数复合满足结合律,即 $h \circ (g \circ f) = (h \circ g) \circ f$。这意味着只要顺序不变,先复合哪两个是无所谓的,所以可以写成 $h \circ g \circ f$。

[总结]

函数复合是将多个函数按顺序连接,创建一个从起点直达终点的新函数的过程。它的核心规则是 $(g \circ f)(a) = g(f(a))$,运算顺序从右至左。

[存在目的]

函数复合是代数思想的核心。在抽象代数中,我们研究的群、环等结构,其运算本身就可以看作是一种函数(例如,加法是一个从 $\mathbb{Z} \times \mathbb{Z}$ 到 $\mathbb{Z}$ 的函数)。而函数复合操作本身,在某些条件下(例如,一个集合到自身的全体双射函数),可以构成一个新的代数结构(一个群,称为置换群或对称群)。它是构建更复杂结构和关系的基本操作。

[直觉心智模型]

- 函数复合:流水线作业。

- $f: A \rightarrow B$ 是第一道工序, $g: B \rightarrow C$ 是第二道工序。

- 原材料 $a$ 从 $A$ 进入,经过第一道工序 $f$ 加工,变成半成品 $f(a)$,它属于 $B$。

- 半成品 $f(a)$ 立刻进入第二道工序 $g$ 加工,变成最终成品 $g(f(a))$,它属于 $C$。

- 复合函数 $g \circ f$ 就是把整条流水线看成一个整体的“黑箱工厂”,你只看到原材料 $a$ 进去,最终成品 $g(f(a))$ 出来,而忽略了中间的半成品步骤。


1.1.4 函数的性质

1.1.4.1 内射、满射、双射
[原文]

设 $f: A \rightarrow B$。

(1) 如果每当 $a_{1} \neq a_{2}$ 时,$f\left(a_{1}\right) \neq f\left(a_{2}\right)$,则 $f$ 是内射单射

(2) 如果对于所有 $b \in B$,存在某个 $a \in A$ 使得 $f(a)=b$,则 $f$ 是满射外射,即 $f$ 的是 $B$ 的全部。请注意,由于函数总是映射到其值域(根据定义),因此为了使满射性问题有意义,需要指定上域 $B$。

(3) 如果 $f$ 既是内射又是满射,则 $f$ 是双射一对一对应。如果存在从 $A$ 到 $B$ 的这种双射 $f$,我们称 $A$ 和 $B$ 双射对应

[逐步解释]

这部分定义了函数的三种关键性质,它们描述了输入和输出之间对应关系的形态。

1. 内射 (Injective) / 单射 (One-to-one)

* 核心思想:不丢失信息。不同的输入必然得到不同的输出。

* 定义:如果 $a_1$ 和 $a_2$ 是定义域中两个不同的元素,那么它们的输出 $f(a_1)$ 和 $f(a_2)$也必然不同。

* 等价的逆否命题:在证明中,我们更常用它的逆否命题形式:如果 $f(a_1) = f(a_2)$,那么必然有 $a_1 = a_2$。也就是说,如果输出相同,那么输入也必然是同一个。

* 直观理解:没有“多对一”的映射,只有“一对一”或“一对无”(如果函数不是满射的)。

2. 满射 (Surjective) / 外射 (Onto)

* 核心思想:覆盖所有目标。上域中的每一个元素都至少被一个输入映射到了。

* 定义:对于上域 $B$ 中的任何一个元素 $b$,你总能(至少)找到一个定义域 $A$ 中的元素 $a$,使得 $f(a)=b$。

* 与值域的关系:一个函数是满射的,当且仅当它的值域等于它的上域,即 $f(A)=B$。

* 上域的重要性:一个函数是不是满射,完全取决于你如何设定它的上域 $B$。例如,$f(x)=x^2$ 作为 $f: \mathbb{R} \rightarrow \mathbb{R}$ 不是满射(因为负数没被覆盖),但作为 $f: \mathbb{R} \rightarrow [0, \infty)$ 就是满射。

3. 双射 (Bijective) / 一对一对应 (One-to-one correspondence)

* 核心思想:完美的配对。

* 定义:函数 $f$ 同时满足内射和满射两个条件。

* 效果:定义域 $A$ 和上域 $B$ 中的元素被完美地、不多不少地一一配对起来。

* 双射对应的集合:如果两个集合之间可以建立一个双射函数,说明这两个集合的“大小”或“基数”是相同的。$|A|=|B|$。这是比较无穷集合大小的基本方法。

[具体数值示例(至少1个,建议≥2个)]

设定义域 $A=\{1, 2, 3\}$,上域 $B=\{x, y, z\}$。

- 内射但非满射: $f_1: A \rightarrow \{w,x,y,z\}$ 定义为 $f_1(1)=x, f_1(2)=y, f_1(3)=z$。

- 内射:不同的输入得到不同的输出。

- 非满射:上域中的 $w$ 没有被任何输入映射到。

- 满射但非内射: $f_2: A \rightarrow \{x, y\}$ 定义为 $f_2(1)=x, f_2(2)=y, f_2(3)=x$。

- 满射:上域中的 $x, y$ 都被映射到了。

- 非内射:不同的输入 $1$ 和 $3$ 得到了相同的输出 $x$。

- 双射: $f_3: A \rightarrow B$ 定义为 $f_3(1)=x, f_3(2)=y, f_3(3)=z$。

- 内射:不同输入对应不同输出。

- 满射:上域 $B$ 中所有元素都被映射到。

- 所以是双射。

- 既非内射也非满射: $f_4: A \rightarrow B$ 定义为 $f_4(1)=x, f_4(2)=x, f_4(3)=y$。

- 非内射:$f_4(1)=f_4(2)$。

- 非满射:$z \in B$ 没有被映射到。

代数函数示例:

- $f: \mathbb{R} \rightarrow \mathbb{R}$, $f(x)=e^x$。

- 内射:若 $e^{x_1} = e^{x_2}$,两边取自然对数,得 $x_1=x_2$。所以是内射。

- 非满射:值域是 $\mathbb{R}^+ = (0, \infty)$,不等于上域 $\mathbb{R}$。例如,$-1$ 在上域中,但没有 $x$ 能使得 $e^x=-1$。

- $g: \mathbb{R} \rightarrow \mathbb{R}$, $g(x)=x^3-x$。

- 非内射:$g(1)=0, g(0)=0, g(-1)=0$。不同输入得到相同输出。

- 满射:这是一个三次多项式,当 $x \to \infty$ 时 $g(x) \to \infty$,当 $x \to -\infty$ 时 $g(x) \to -\infty$。由于函数是连续的,它会取遍所有实数值。所以是满射。

- $h: \mathbb{R} \rightarrow \mathbb{R}$, $h(x)=ax+b$ ($a \neq 0$)。

- 内射:若 $ax_1+b = ax_2+b$,则 $ax_1=ax_2$,因为 $a \neq 0$,所以 $x_1=x_2$。

- 满射:对于任意 $y \in \mathbb{R}$,我们能找到 $x = (y-b)/a$ 使得 $h(x)=y$。

- 所以任何非水平的直线函数都是双射

[易错点与边界情况]

- 内射和“一对一”的混用:在很多非正式场合,“一对一”(one-to-one) 可能指内射,也可能指双射。本书明确指出单射是 Injective,而一对一对应是 Bijective,这更为严谨。

- 满射依赖于上域:必须时刻记住,满射不是函数自身的固有属性,而是函数与其指定上域之间关系的属性。

- 空函数:从空集 $\emptyset$ 到任何非空集合 $B$ 的函数是存在的(只有一种,称为空函数),并且它是内射的(因为“每当 $a_1 \neq a_2$”这个条件永远为假,所以整个命题为真),但不是满射的。

- 纤维与性质的关系

- 一个函数是内射的,当且仅当所有纤维要么是空集,要么是单元素集合。

- 一个函数是满射的,当且仅当所有纤维都不是空集。

[总结]

内射、满射和双射是描述函数映射行为的三个基本分类。内射保证了不压缩信息(没有多对一),满射保证了完全覆盖目标(没有漏掉的),双射则是一种完美的、可逆的配对。

[存在目的]

这三种性质在抽象代数中至关重要。

- 双射是判断两个代数结构是否“同构”(在结构上完全相同)的基础。一个保持结构的双射映射(同构映射)意味着两个结构只是“贴了不同的标签”而已。

- 内射让我们能将一个小的代数结构“嵌入”到一个大的代数结构中(单一同态)。

- 满射让我们能将一个大的代数结构“投影”到一个小的代数结构上,揭示其商结构(满同态)。

这些都是通过函数来理解和关联不同代数对象的基本手段。

[直观想象]

想象一场舞会,男士集合 $A$ 与女士集合 $B$ 跳舞,函数 $f$ 是配对规则。

- 内射:没有“一女配多男”的情况。每个跳舞的女士只与一位男士配对。但可能有些女士在旁边休息,没被配对。

- 满射:所有女士都被邀请跳舞了,舞池里没有休息的女士。但可能存在“一女配多男”的情况(如果男士比女士多)。

- 双射:完美搭配!每个男士都与一位且仅一位女士配对,而且所有女士都下场跳舞了。男士和女士人数正好相等。


1.1.4.2 逆函数
[原文]

(4) 如果存在一个函数 $g: B \rightarrow A$ 使得 $g \circ f: A \rightarrow A$ 是 $A$ 上的恒等映射,即对于所有 $a \in A$,$(g \circ f)(a)=a$,则 $f$ 具有左逆

(5) 如果存在一个函数 $h: B \rightarrow A$ 使得 $f \circ h: B \rightarrow B$ 是 $B$ 上的恒等映射,则 $f$ 具有右逆

[逐步解释]

这部分从复合函数的角度来定义“逆”的概念。

1. 恒等映射 (Identity Map)

* 在一个集合 $S$ 上的恒等映射,通常记作 $id_S$,是一个从 $S$ 到 $S$ 的函数,它什么也不做。$id_S(s) = s$ 对所有 $s \in S$ 成立。

2. 左逆 (Left Inverse)

* 函数 $f: A \rightarrow B$ 有一个左逆 $g: B \rightarrow A$,如果先把 $f$ 作用,再把 $g$ 作用,最终等于什么都没做,回到了起点。

* $g \circ f = id_A$。

* 这意味着对于任何 $a \in A$,都有 $g(f(a))=a$。

* 这就像 $g$ 能“撤销” $f$ 的操作。

3. 右逆 (Right Inverse)

* 函数 $f: A \rightarrow B$ 有一个右逆 $h: B \rightarrow A$,如果先把 $h$ 作用,再把 $f$ 作用,最终等于在 $B$ 上什么都没做。

* $f \circ h = id_B$。

* 这意味着对于任何 $b \in B$,都有 $f(h(b))=b$。

* 这就像 $h$ 能为 $f$ 的任何一个目标“找到一个源头”。

[具体数值示例(至少1个,建议≥2个)]

设 $A=\{1, 2\}$, $B=\{x, y, z\}$。

示例1:左逆 (对应内射)

- 设 $f: A \rightarrow B$ 为 $f(1)=x, f(2)=y$。这是个内射函数。

- 我们可以定义一个左逆 $g: B \rightarrow A$。

- $g(x)=1$, $g(y)=2$。

- 对于 $z$,我们可以随便定义,比如 $g(z)=1$。

- 验证

- $(g \circ f)(1) = g(f(1)) = g(x) = 1$。

- $(g \circ f)(2) = g(f(2)) = g(y) = 2$。

- 所以 $g \circ f = id_A$。$g$ 是 $f$ 的一个左逆。

- 注意:左逆不唯一。我们也可以定义 $g'(z)=2$,得到另一个左逆 $g'$。

示例2:右逆 (对应满射)

- 设 $A=\{p, q, r\}$, $B=\{x, y\}$。

- 设 $h: A \rightarrow B$ 为 $h(p)=x, h(q)=y, h(r)=x$。这是个满射函数。

- 我们可以定义一个右逆 $k: B \rightarrow A$。

- 对于 $x \in B$,它的纤维是 $\{p, r\}$。我们必须为 $k(x)$ 选择其中一个,比如我们选 $p$。所以 $k(x)=p$。

- 对于 $y \in B$,它的纤维是 $\{q\}$。我们必须选 $q$。所以 $k(y)=q$。

- 这个 $k$ 就是一个从 $B$ 到 $A$ 的函数。

- 验证

- $(h \circ k)(x) = h(k(x)) = h(p) = x$。

- $(h \circ k)(y) = h(k(y)) = h(q) = y$。

- 所以 $h \circ k = id_B$。$k$ 是 $h$ 的一个右逆。

- 注意:右逆不唯一。我们也可以定义 $k'(x)=r$,得到另一个右逆 $k'$。

[易错点与边界情况]

- 单侧逆的不唯一性:当函数只是内射而非双射,或者只是满射而非双射时,其左逆或右逆通常不唯一。

- 存在性:不是所有函数都有左逆或右逆。没有左逆的函数不是内射的,没有右逆的函数不是满射的。

[总结]

左逆和右逆是通过函数复合来定义的逆的概念。左逆可以“撤销”原函数的操作,回到定义域的恒等映射。右逆可以“预备”输入,使得原函数作用后得到上域的恒等映射。

[存在目的]

将函数的内射和满射性质与左逆和右逆的存在性联系起来,是通往更抽象代数观点的重要一步。它将一个看似几何的性质(映射的样子)转化为了一个纯粹的代数性质(某个方程是否有解)。这种代数化的思想是抽象代数的核心方法论之一。下面的命题将正式建立这种联系。

[直觉心智模型]

- $f$ 是一个编码过程,它的逆是解码过程。

- 左逆 $g$:你把信息 $a$ 编码成 $f(a)$,然后通过 $g$ 解码,还能完美地恢复成 $a$。这意味着编码过程 $f$ 没有丢失任何信息(内射)。

- 右逆 $h$:对于任何可能的目标信息 $b$,你都能通过 $h$ 找到一个“假”的源信息 $h(b)$,然后用 $f$ 编码它,就能精确地得到 $b$。这意味着编码过程 $f$ 的能力足以产生所有可能的目标信息(满射)。


1.1.5 命题1:函数性质与逆的等价关系

[原文]

命题 1。设 $f: A \rightarrow B$。

(1) 映射 $f$ 是内射当且仅当 $f$ 具有左逆

(2) 映射 $f$ 是满射当且仅当 $f$ 具有右逆

(3) 映射 $f$ 是双射当且仅当存在 $g: B \rightarrow A$ 使得 $f \circ g$ 是 $B$ 上的恒等映射且 $g \circ f$ 是 $A$ 上的恒等映射

(4) 如果 $A$ 和 $B$ 是具有相同元素数量的有限集合(即 $|A|=|B|$),则 $f: A \rightarrow B$ 是双射当且仅当 $f$ 是内射当且仅当 $f$ 是满射

证明:练习。

在上述命题的第 (3) 部分中,映射 $g$ 必然是唯一的,我们称 $g$ 是 $f$ 的双侧逆(或简称)。

[逐步解释]

这个命题是前面所有概念的一个重要小结,它将函数的几何性质(内射/满射)和代数性质(左逆/右逆的存在)完全等价了起来。

1. 内射 $\iff$ 左逆:

* 一个函数是内射的,和它有一个左逆,是同一件事。

* ($\Rightarrow$) 如果 $f$ 是内射的,我们可以构造一个左逆 $g$。对于值域 $f(A)$ 中的每个元素 $y$,由于 $f$ 是内射,有唯一的 $x$ 使得 $f(x)=y$,我们就定义 $g(y)=x$。对于不在值域中的元素, $g$ 可以把它们随便映射到 $A$ 中任何一个元素。这样构造的 $g$ 满足 $g(f(x))=x$。

* ($\Leftarrow$) 如果 $f$ 有左逆 $g$,那么若 $f(a_1)=f(a_2)$,我们可以对两边同时作用 $g$,得到 $g(f(a_1))=g(f(a_2))$。根据左逆定义,这等于 $a_1=a_2$。这就证明了 $f$ 是内射的。

2. 满射 $\iff$ 右逆:

* 一个函数是满射的,和它有一个右逆,是同一件事。

* ($\Rightarrow$) 如果 $f$ 是满射的,对于上域 $B$ 中的任何一个元素 $b$,它的纤维 $f^{-1}(\{b\})$ 都不是空的。我们可以构造一个右逆 $h$,方法是:对于每个 $b \in B$,从它的非空纤维中选择一个元素,作为 $h(b)$ 的值。(这里隐式地使用了选择公理)。这样构造的 $h$ 满足 $f(h(b))=b$。

* ($\Leftarrow$) 如果 $f$ 有右逆 $h$,那么对于任何 $b \in B$,我们都能找到一个 $a \in A$(就是 $h(b)$),使得 $f(a)=f(h(b))=b$。这正是满射的定义。

3. 双射 $\iff$ 双侧逆:

* 一个函数是双射的,当且仅当它既有左逆又有右逆,并且这个左逆和右逆是同一个函数 $g$。

* 这个函数 $g$ 被称为 $f$ 的逆函数,记作 $f^{-1}$。

* 这个逆函数 $g$ 是唯一的。证明:假设 $g_1, g_2$ 都是 $f$ 的逆。那么 $g_1 = g_1 \circ id_B = g_1 \circ (f \circ g_2) = (g_1 \circ f) \circ g_2 = id_A \circ g_2 = g_2$。所以 $g_1=g_2$。

4. 有限集合上的特殊情况 (鸽巢原理)

* 这个性质只对有限等势(元素个数相同)的集合之间的映射成立。

* 如果两个有限集合的“容量”一样大,那么从一个到另一个的映射,只要满足内射、满射、双射三者中的任何一个,另外两个就自动成立。

- 内射 $\Rightarrow$ 满射:如果你有 $n$ 个不同的东西(内射),要放进 $n$ 个不同的坑里,那么每个坑必然都恰好被占了一个(满射)。

- 满射 $\Rightarrow$ 内射:如果你用 $n$ 个东西填满了 $n$ 个坑(满射),那么必然不可能有两个东西在同一个坑里(内射),否则就会有空坑。

* 重要:这个性质对无穷集合不成立!例如,$f: \mathbb{Z} \rightarrow \mathbb{Z}$ 定义为 $f(n)=2n$ 是内射的,但不是满射的。

[具体数值示例(至少1个,建议≥2个)]

有限集合示例 (Part 4):

- 设 $A=\{1,2,3\}, B=\{x,y,z\}$。$|A|=|B|=3$。

- 内射 $\Rightarrow$ 双射: 设 $f: A \rightarrow B$ 是内射的,例如 $f(1)=x, f(2)=y, f(3)=z$。值域是 $\{x,y,z\}$,大小为3。因为值域是上域 $B$ 的子集,且大小与 $B$ 相同,所以值域必定等于上域 $B$。因此 $f$ 是满射的。由于 $f$ 既内射又满射,所以是双射。

- 满射 $\Rightarrow$ 双射: 设 $g: A \rightarrow B$ 是满射的。这意味着 $A$ 中至少有3个元素的像,才可能覆盖 $B$ 中所有的3个元素。但 $A$ 总共就只有3个元素,所以这3个元素必须映射到3个不同的值,否则无法覆盖 $B$。因此 $g$ 必然是内射的。由于 $g$ 既满射又内射,所以是双射。

[易错点与边界情况]

- 对无穷集合滥用 Part 4:这是最常见的错误。再次强调,对于无穷集合,$|A|=|B|$ 时,内射不一定满射,满射也不一定内射。

- 内射非满射: $f:\mathbb{Z}^+ \to \mathbb{Z}^+, f(n)=n+1$。

- 满射非内射: $g:\mathbb{Z} \to \mathbb{Z}, g(n) = \lfloor n/2 \rfloor$ (向下取整)。

- 混淆逆像符号 $f^{-1}(C)$ 和逆函数 $f^{-1}$:在命题(3)之后,符号 $f^{-1}$ 开始有了双重含义。如果 $f$ 是双射, $f^{-1}$ 可以指那个唯一的逆函数。但在一般情况下,$f^{-1}(...)$ 仍然是指原像(一个集合)。必须根据上下文判断。

[总结]

命题1是函数理论的一个基石。它深刻地揭示了:内射性等价于存在左逆,满射性等价于存在右逆,而双射性等价于存在一个唯一的、双侧的逆函数。对于元素个数相同的有限集合,这三个性质是等价的。

[存在目的]

这个命题为后续的代数研究提供了强有力的工具。它允许我们在“几何”的映射性质和“代数”的逆的存在性之间自由切换。例如,要证明一个群同构(一个保持结构的双射),我们可以去构造一个保持结构的逆函数,然后证明它们的复合是恒等映射。这通常比直接证明内射和满射更容易。 Part 4 在组合数学和有限群论中也极其有用。

[直觉心智模型]

- 内射 $\iff$ 左逆: 你的编码过程 $f$ 是无损的(内射),当且仅当你能造一个解码器 $g$ 把编码后的 $f(a)$ 还原成 $a$(左逆)。

- 满射 $\iff$ 右逆: 你的编码过程 $f$ 能产生所有可能的目标(满射),当且仅当你对任何一个目标 $b$,都能找到一个源头 $h(b)$,编码后恰好得到 $b$(右逆)。

- 双射 $\iff$ 双侧逆: 你的编码过程 $f$ 是完美的一一对应(双射),当且仅当你有一个完美的解码器 $g$,它既能作为左逆(解码),又能作为右逆(找源头),并且是唯一的。

- Part 4: 在一个“萝卜”和“坑”数量相等的有限场景里,“每个萝卜都有自己的坑”(内射)和“每个坑里都有一个萝卜”(满射)其实说的是一回事。


1.1.6 置换

[原文]

集合 $A$ 的置换(permutation)就是从 $A$ 到自身的一个双射

[逐步解释]

这是一个非常重要的定义。

- 什么是置换:一个置换本质上是一个函数。

- 函数的类型:这个函数非常特殊,它是一个从某个集合 $A$ 到其自身的双射函数,即 $f: A \rightarrow A$ 且 $f$ 是双射。

- 作用:一个置换的作用就是把集合 $A$ 内部的元素重新排列或“洗牌”。因为是双射,所以保证了没有元素被漏掉,也没有元素被复制,只是位置发生了改变。

[具体数值示例(至少1个,建议≥2个)]

示例1

- 设集合 $A = \{1, 2, 3\}$。

- 一个置换 $\sigma: A \rightarrow A$ 可以是:

- $\sigma(1) = 2$

- $\sigma(2) = 3$

- $\sigma(3) = 1$

- 这个置换把 1 移动到 2 的位置,2 移动到 3 的位置,3 移动到 1 的位置。这形成了一个循环。

- 这显然是一个双射:

- 内射:$1,2,3$ 的像 $2,3,1$ 各不相同。

- 满射:值域 $\{2,3,1\}$ 等于上域 $\{1,2,3\}$。

- 另一种常见的表示法是柯西双行表示法:

$$ \sigma = \begin{pmatrix} 1 & 2 & 3 \\ 2 & 3 & 1 \end{pmatrix} $$

上面一行是输入,下面一行是对应的输出。

示例2

- 在同一个集合 $A = \{1, 2, 3\}$ 上。

- 另一个置换 $\tau: A \rightarrow A$ 可以是:

- $\tau(1) = 2$

- $\tau(2) = 1$

- $\tau(3) = 3$

- 这个置换交换了 1 和 2,但保持 3 不动。

- 表示为:

$$ \tau = \begin{pmatrix} 1 & 2 & 3 \\ 2 & 1 & 3 \end{pmatrix} $$

- 恒等置换:什么都不做的置换也是一个置换,称为恒等置换 $id$。

- $id(1)=1, id(2)=2, id(3)=3$。

- $id = \begin{pmatrix} 1 & 2 & 3 \\ 1 & 2 & 3 \end{pmatrix}$。

[易错点与边界情况]

- 置换的定义域和上域必须是同一个集合

- 置换必须是双射。例如 $f:\{1,2,3\} \to \{1,2,3\}$ 定义为 $f(x)=1$ 对所有 $x$ 成立,这不是一个置换。

- 对于一个有 $n$ 个元素的有限集合,总共有 $n!$ (n的阶乘) 个不同的置换。例如,对于 $A=\{1,2,3\}$,有 $3! = 3 \times 2 \times 1 = 6$ 个置换。

[总结]

置换是对一个集合内的元素进行重新排列的一种数学形式化描述,其本质是一个从该集合到其自身的双射函数。

[存在目的]

置换是群论的起源和核心范例。对于一个集合 $A$,其上所有置换的集合,在函数复合这个运算下,构成了一个非常重要的代数结构——对称群 (Symmetric Group),记作 $S_A$(如果 $A=\{1, ..., n\}$,则记作 $S_n$)。研究对称群的性质是理解所有有限群的关键(凯莱定理),因此置换的概念是进入群论学习的门户。

[直觉心智模型]

- 置换:一套洗牌的动作。

- 集合A:一副扑克牌。

- 一个置换就是你对这副牌执行的一种特定的、无重复、无遗漏的重新排列方式。

- 函数复合:连续做两种不同的洗牌动作。

- 对称群:所有可能的洗牌动作的集合。


1.1.6.1 限制与扩张
[原文]

如果 $A \subseteq B$ 且 $f: B \rightarrow C$,我们用 $\left.f\right|_{A}$ 表示 $f$ 对 $A$ 的限制。当我们所考虑的定义域是明确的,即使这些是形式上不同的函数(它们的定义域不同),我们偶尔也会将 $\left.f\right|_{A}$ 再次简单地表示为 $f$。

如果 $A \subseteq B$ 且 $g: A \rightarrow C$,并且存在一个函数 $f: B \rightarrow C$ 使得 $\left.f\right|_{A}=g$,我们将称 $f$ 是 $g$ 到 $B$ 的扩张(这样的映射 $f$ 不一定存在,也不一定唯一)。

[逐步解释]

这部分介绍了两个互为逆操作的概念:限制和扩张。

1. 限制 (Restriction)

* 情景:你有一个定义在某个大集合 $B$ 上的函数 $f$。现在你只关心这个函数在 $B$ 的一个子集 $A$ 上的表现。

* 操作:创建一个新函数,记作 $\left.f\right|_{A}$。

* 新函数的定义

- 它的定义域是子集 $A$。

- 它的上域和原函数 $f$ 相同,都是 $C$。

- 它的映射规则和原函数 $f$ 在 $A$ 上的规则完全一样。即对于任何 $a \in A$,$\left.f\right|_{A}(a) = f(a)$。

* 本质:就是把函数的定义域“缩小”。

* 符号滥用:作者提到,有时为了方便,即使我们讨论的是限制后的函数 $\left.f\right|_{A}$,我们可能仍然只写 $f$。这要求读者根据上下文来判断当前 $f$ 的实际定义域是哪个。

2. 扩张 (Extension)

* 情景:你有一个只定义在小集合 $A$ 上的函数 $g$。你想把它变成一个定义在更大的集合 $B$(其中 $A \subseteq B$)上的函数 $f$。

* 操作:找到或构造一个新函数 $f: B \rightarrow C$。

* 要求:这个新函数 $f$ 在小集合 $A$ 上的行为必须和原来的 $g$ 完全一样。用限制的语言来说,就是 $\left.f\right|_{A}=g$。

* 本质:就是把函数的定义域“扩大”。

* 存在性和唯一性:扩张不总是存在的,即便存在,也通常不唯一。因为对于那些在 $B$ 中但不在 $A$ 中的元素(即 $B \setminus A$),你可以把它们映射到 $C$ 中的任何元素,从而得到不同的扩张。

[具体数值示例(至少1个,建议≥2个)]

示例1:限制

- 设函数 $f: \mathbb{R} \rightarrow \mathbb{R}$ 为 $f(x)=x^2$。

- 设子集 $A = \mathbb{Z}^+ = \{1, 2, 3, \ldots\}$。

- $f$ 对 $A$ 的限制是 $\left.f\right|_{A}: \mathbb{Z}^+ \rightarrow \mathbb{R}$,其规则是 $\left.f\right|_{A}(n)=n^2$。

- 原函数 $f$ 不是内射的(例如 $f(-2)=f(2)=4$)。

- 但限制后的函数 $\left.f\right|_{\mathbb{Z}^+}$ 是内射的,因为对于不同的正整数,它们的平方也不同。

- 这说明通过限制定义域,可以改变函数的性质。

示例2:扩张

- 设函数 $g: \{0, 1\} \rightarrow \mathbb{R}$ 为 $g(0)=1, g(1)=-1$。

- 我们想把它扩张到整个 $\mathbb{R}$ 上,即找到一个 $f: \mathbb{R} \rightarrow \mathbb{R}$ 使得 $\left.f\right|_{\{0,1\}} = g$。

- 一个可能的扩张:$f_1(x) = \cos(\pi x)$。

- 验证:$f_1(0)=\cos(0)=1=g(0)$,$f_1(1)=\cos(\pi)=-1=g(1)$。所以 $f_1$ 是 $g$ 的一个扩张。

- 另一个可能的扩张:$f_2(x) = 1-2x$。

- 验证:$f_2(0)=1-0=1=g(0)$,$f_2(1)=1-2=-1=g(1)$。所以 $f_2$ 也是 $g$ 的一个扩张。

- 无数个扩张:我们可以定义 $f_3(x)$ 如下:如果 $x=0, f_3(x)=1$; 如果 $x=1, f_3(x)=-1$; 对于其他所有 $x$,让 $f_3(x)=42$。这也是一个合法的扩张。

- 这说明扩张通常不唯一

[易错点与边界情况]

- 形式上是不同函数:$f$ 和 $\left.f\right|_{A}$ 是两个不同的函数,因为它们的定义域不同。但在实践中,为了简洁,常常会混用。

- 扩张的存在性:并非总能扩张。例如,如果一个性质(如连续性)被要求在扩张后的函数上保持,那么可能不存在这样的扩张。

[总结]

限制是“裁剪”一个函数的定义域,只关注其在子集上的行为。扩张是“延伸”一个函数的定义域,使其能处理更大的输入范围,同时保持在原子集上的行为不变。

[存在目的]

这两个概念在高等数学中非常普遍。

- 限制:允许我们通过研究一个复杂函数在更简单、结构更好的子集上的行为,来推断其局部性质。例如,在复分析中,研究一个复变函数在实轴上的限制。

- 扩张:这是许多重要数学定理的核心主题。例如,分析学中的“函数延拓”就是要将一个只在某个区域有良好定义的解析函数,尽可能地扩张到更大的复平面区域。代数中的例子是,是否能将一个定义在整环上的运算,扩张到其分式域上。

[直觉心- [直觉心智模型]

- 限制:你有一个全国范围的政策 $f$(例如,全国统一邮费标准)。现在你只想研究这个政策在“北京市”$A$ 的具体实施情况,这就是 $\left.f\right|_{A}$。

- 扩张:你有一个只在“北京市”$A$ 实施的试点政策 $g$(例如,垃圾分类规定)。现在你想把它推广为全国性政策 $f$,要求是在北京市内,新政策 $f$ 的规定必须和旧的试点政策 $g$ 完全一样。至于北京以外的地区如何规定,你有很大的自由度,从而可以制定出不同的全国政策 $f_1, f_2, \ldots$。


1.1.7 关系与划分

1.1.7.1 二元关系
[原文]

设 $A$ 是一个非空集合

(1) 集合 $A$ 上的二元关系是 $A \times A$ 的一个子集 $R$,如果 $(a, b) \in R$,我们记作 $a \sim b$。

[逐步解释]

这部分将“关系”这个日常概念进行了数学上的精确定义。

1. 二元关系 (Binary Relation):一个二元关系是用来描述一个集合内部元素之间是否存在某种联系的方式。

2. 数学定义:在集合 $A$ 上的一个二元关系 $R$,被严格定义为笛卡尔积 $A \times A$ 的一个子集

3. 理解定义

* $A \times A$ 包含了所有可能的元素对 $(a, b)$,其中 $a, b$ 都来自 $A$。

* 一个关系 $R$ 就是从所有这些可能的配对中,挑出一部分。

* 如果一对元素 $(a, b)$ 被挑中了,即 $(a, b) \in R$,我们就说 "$a$ 与 $b$ 有关系 $R$"。

4. 关系符号 $\sim$

* 为了更自然地书写,我们通常不用集合的写法 $(a, b) \in R$,而是用一个中缀符号来表示关系,最通用的就是波浪号 $\sim$。

* $a \sim b$ 和 $(a, b) \in R$ 是完全等价的。

* 根据具体的关系,我们也会用其它符号,比如 $<, \le, =, |$ (整除) 等。

[具体数值示例(至少1个,建议≥2个)]

示例1:小于关系

- 设集合 $A = \{1, 2, 3\}$。

- $A \times A = \{(1,1), (1,2), (1,3), (2,1), (2,2), (2,3), (3,1), (3,2), (3,3)\}$。

- 我们定义一个“小于”关系,用符号 $<$ 表示。

- 这个关系对应的子集 $R_<$ 是什么呢?我们挑出所有满足 $a < b$ 的配对 $(a, b)$。

- $R_< = \{(1, 2), (1, 3), (2, 3)\}$。

- 所以,$(1, 2) \in R_<$ 等价于 $1 < 2$。

- $(2, 1) \notin R_<$,因为 $2 < 1$ 不成立。

示例2:整除关系

- 设集合 $B = \{1, 2, 3, 4, 5, 6\}$。

- 我们定义一个“整除”关系,用符号 $|$ 表示。$a|b$ 意为 "$a$ 整除 $b$"。

- 这个关系对应的子集 $R_|$ 是所有满足 $a$ 能整除 $b$ 的配对 $(a, b)$。

- $R_| = \{(1,1), (1,2), ..., (1,6), (2,2), (2,4), (2,6), (3,3), (3,6), (4,4), (5,5), (6,6)\}$。

- 例如,$(2, 6) \in R_|$ 因为 $2|6$。

- $(3, 5) \notin R_|$ 因为 3 不能整除 5。

[易错点与边界情况]

- 关系是有向的:因为基础是有序对 $(a, b)$,所以 $a \sim b$ 和 $b \sim a$ 是两回事。例如,在小于关系中,$1<2$ 成立,但 $2<1$ 不成立。

- 关系就是集合:从根本上说,一个关系就是一个有序对的集合。这种看似奇怪的定义,好处是把所有类型的关系都统一到了集合论的框架下,非常便于进行严格的逻辑推理。

[总结]

一个集合上的二元关系,被精确地定义为该集合与自身的笛卡尔积的一个子集。这个子集明确地列出了所有满足该关系的有序元素对。

[存在目的]

关系是构建代数结构的基础。等价关系(下面会讲到)是定义商集、同余类等核心概念的工具。序关系(如 $\le$)则引出格、序理论等其他代数分支。将关系形式化为集合,是进行严格数学研究的第一步。

[直觉心智模型]

- 集合A: 班级里的所有同学。

- 笛卡尔积 $A \times A$: 所有可能的“甲同学指向乙同学”的配对名单。

- 一个二元关系 $R$: 一份具体的名单子集。例如,“暗恋关系” $R_{crush}$。如果 (张三, 李四) $\in R_{crush}$,就表示张三暗恋李四。这不代表李四也暗恋张三。


1.1.7.2 等价关系
[原文]

(2) 集合 $A$ 上的关系 $\sim$ 被称为:

(a) 自反的,如果对于所有 $a \in A$,有 $a \sim a$,

(b) 对称的,如果对于所有 $a, b \in A$, $a \sim b$ 蕴含 $b \sim a$,

(c) 传递的,如果对于所有 $a, b, c \in A$, $a \sim b$ 且 $b \sim c$ 蕴含 $a \sim c$。

如果一个关系自反对称传递的,则它是一个等价关系

[逐步解释]

这部分定义了一种非常特殊的、性质良好的关系——等价关系 (Equivalence Relation)。它必须同时满足三个性质:

1. 自反性 (Reflexive)

* 要求:每个元素都与它自身有关系。$a \sim a$。

* 直观意义:自己等于自己。

* 集合角度:关系 $R$ 必须包含所有的对角线元素 $(a, a)$。

2. 对称性 (Symmetric)

* 要求:如果 $a$ 与 $b$ 有关系,那么 $b$ 也必须与 $a$ 有关系。$a \sim b \implies b \sim a$。

* 直观意义:关系是双向的,没有方向性。

* 集合角度:如果 $(a, b) \in R$,那么 $(b, a)$也必须在 $R$ 中。

3. 传递性 (Transitive)

* 要求:如果 $a$ 与 $b$ 有关系,且 $b$ 与 $c$ 有关系,那么 $a$ 必须与 $c$ 有关系。$(a \sim b \text{ and } b \sim c) \implies a \sim c$。

* 直观意义:关系可以“传递”或“搭桥”。

* 集合角度:如果 $(a, b) \in R$ 且 $(b, c) \in R$,那么 $(a, c)$ 也必须在 $R$ 中。

一个关系同时满足这三个“好”性质,就被称为等价关系。等价关系本质上是对“等于”这个概念的推广。

[具体数值示例(至少1个,建议≥2个)]

示例1:模n同余关系 (最重要的例子)

- 设集合为整数集 $\mathbb{Z}$,并固定一个正整数 $n$ (比如 $n=5$)。

- 定义关系 $\sim$ 为:$a \sim b$ 当且仅当 $a$ 和 $b$ 除以 5 的余数相同。这等价于 $5 | (a-b)$。

- 检查性质:

- 自反性:对任意整数 $a$,$a-a=0$,$5|0$ 成立。所以 $a \sim a$。

- 对称性:如果 $a \sim b$,则 $5 | (a-b)$。这意味着 $a-b = 5k$。那么 $b-a = -5k = 5(-k)$,所以 $5 | (b-a)$。因此 $b \sim a$。

- 传递性:如果 $a \sim b$ 且 $b \sim c$,则 $5 | (a-b)$ 且 $5 | (b-c)$。这意味着 $a-b=5k_1$,$b-c=5k_2$。两式相加,$(a-b)+(b-c) = 5k_1+5k_2$,即 $a-c = 5(k_1+k_2)$。所以 $5|(a-c)$。因此 $a \sim c$。

- 结论:模5同余是一个等价关系

示例2:小于等于关系 ($\le$)

- 设集合为实数集 $\mathbb{R}$。

- 检查性质:

- 自反性:$a \le a$ 成立。

- 对称性:$a \le b$ 是否蕴含 $b \le a$?不一定。例如 $3 \le 5$,但 $5 \le 3$ 不成立。所以不满足对称性

- 传递性:如果 $a \le b$ 且 $b \le c$,则 $a \le c$ 成立。

- 结论:因为不满足对称性,所以 $\le$ 不是等价关系。(它是一种“偏序关系”)。

示例3:生日相同关系

- 设集合为“世界上所有的人”。

- 定义关系 $\sim$ 为:“$a$ 与 $b$ 的生日在同一天”。

- 检查性质:

- 自反性:任何人都和自己的生日在同一天。成立。

- 对称性:如果 A 和 B 生日相同,那么 B 和 A 生日也相同。成立。

- 传递性:如果 A 和 B 生日相同,B 和 C 生日也相同,那么 A 和 C 的生日必然相同。成立。

- 结论:这是一个等价关系

[易错点与边界情况]

- 三个性质缺一不可。很多常见的关系(如 $<, \subseteq$)满足自反和传递,但不满足对称。

- 在检查传递性时要小心。例如,关系“是朋友”在社交网络上通常不是传递的:A是B的朋友,B是C的朋友,不代表A就是C的朋友。

[总结]

等价关系是一种模仿“等于”号行为的特殊关系,它必须同时具备自反、对称、传递三个特性。这种关系的核心作用是用来对集合进行分类。

[存在目的]

等价关系的唯一目的就是用来划分集合。它能把一个大集合,根据某种“等价”的标准,完美地分割成若干个互不相交的、装满了“等价”元素的子集(即等价类)。这是构造商集、商群、商环等一系列核心代数概念的基础。可以说,没有等价关系,就没有抽象代数的大半壁江山。

[直觉心智模型]

- 等价关系:一台分类机。

- 集合A: 一大堆各种颜色和形状的积木。

- 一个等价关系就是一种分类标准。例如,标准 $\sim$ 是“颜色相同”。

- 自反性:每个积木和自己都是同色的。

- 对称性:如果积木1和积木2同色,那积木2和积木1也同色。

- 传递性:如果积木1和2同色,2和3同色,那1和3也必然同色。

- 这个分类标准(等价关系)最终会把所有积木分到不同的篮子里,每个篮子里装的都是同一种颜色的积木。


1.1.7.3 等价类与划分
[原文]

(3) 如果 $\sim$ 定义了 $A$ 上的等价关系,那么 $a \in A$ 的等价类定义为 $\{x \in A \mid x \sim a\}$。等价类 $a$ 中的元素被称为与 $a$ 等价。如果 $C$ 是一个等价类,则 $C$ 的任何元素都称为该代表元

(4) $A$ 的划分非空子集的任何集合族 $\left\{A_{i} \mid i \in I\right\}$($I$ 为某个索引集),使得

(a) $A=\cup_{i \in I} A_{i}$,且

(b) 对于所有 $i, j \in I$ 且 $i \neq j$,有 $A_{i} \cap A_{j}=\emptyset$,

即 $A$ 是划分集合不相交并集

[逐步解释]

这部分定义了等价关系的直接产物——等价类,以及与之一体两面的概念——划分。

1. 等价类 (Equivalence Class)

* 一旦你在集合 $A$ 上有了一个等价关系 $\sim$。

* 对于任何一个元素 $a \in A$,它的等价类(通常记作 $[a]$ 或 $\bar{a}$)是 $A$ 的一个子集。

* 这个子集包含了 $A$ 中所有与 $a$ “等价”的元素。

* 定义:$[a] = \{x \in A \mid x \sim a\}$。

2. 代表元 (Representative)

* 一个等价类是一个集合。这个集合里的任何一个元素,都可以被选出来作为这个类的“名字”或“代表”。

* 例如,在模5同余中,与2同余的等价类是 $[2] = \{\ldots, -8, -3, 2, 7, 12, \ldots\}$。

* 我们可以称它为“2的等价类”,记作 $[2]$。但我们也可以称它为“7的等价类”,记作 $[7]$,因为 $2 \sim 7$,所以 $[2]$ 和 $[7]$ 是完全相同的集合。

* 2, 7, -3 等都是这个等价类的代表元。

3. 划分 (Partition)

* 一个划分是将一个大集合 $A$ 切割成一堆小块(子集 $A_i$)的方式。

* 划分的两个条件

- (a) 并集为全集: 所有小块拼起来,必须能完整地复原整个大集合 $A$,没有遗漏。

- (b) 两两不相交: 任意两个不同的小块之间都没有重叠部分。

* 总结:划分就是把集合 $A$ 表示为一堆互不相交的非空子集的并。

[具体数值示例(至少1个,建议≥2个)]

示例1:模3同余的等价类和划分

- 集合 $A = \mathbb{Z}$,关系是模3同余。

- 找等价类:

- 0的等价类 $[0]$:所有除以3余0的数。$[0] = \{\ldots, -6, -3, 0, 3, 6, \ldots\}$。

- 1的等价类 $[1]$:所有除以3余1的数。$[1] = \{\ldots, -5, -2, 1, 4, 7, \ldots\}$。

- 2的等价类 $[2]$:所有除以3余2的数。$[2] = \{\ldots, -4, -1, 2, 5, 8, \ldots\}$。

- 3的等价类 $[3]$:所有除以3余3(也就是余0)的数。$[3] = \{\ldots, -3, 0, 3, \ldots\}$。我们发现 $[3] = [0]$。

- 结论:这个等价关系只产生了三个不同的等价类:$[0], [1], [2]$。

- 验证划分:

- 这三个等价类都是非空的。

- 它们的并集是 $[0] \cup [1] \cup [2] = \mathbb{Z}$。任何一个整数,其除以3的余数必然是0, 1, 2之一,所以它必然在这三个集合中的某一个里。

- 它们两两不相交。一个数不可能同时余1又余2。$[0] \cap [1] = \emptyset$, $[0] \cap [2] = \emptyset$, $[1] \cap [2] = \emptyset$。

- 所以,集合 $\{[0], [1], [2]\}$ 构成了整数集 $\mathbb{Z}$ 的一个划分

示例2:按首字母划分

- 设集合 $A=\{\text{apple}, \text{ant}, \text{boy}, \text{ball}, \text{cat}\}$。

- 定义等价关系 $x \sim y$ 为“x和y有相同的首字母”。

- 等价类:

- $[\text{apple}] = \{\text{apple}, \text{ant}\}$

- $[\text{boy}] = \{\text{boy}, \text{ball}\}$

- $[\text{cat}] = \{\text{cat}\}$

- 这三个等价类 $\{ \{\text{apple}, \text{ant}\}, \{\text{boy}, \text{ball}\}, \{\text{cat}\} \}$ 构成了集合 $A$ 的一个划分。

[易错点与边界情况]

- 同一个等价类,不同的代表元:$[a]=[b]$ 当且仅当 $a \sim b$。初学者容易误以为 $[a]$ 和 $[b]$ 是不同的集合,而实际上它们可能完全相同。

- 划分中的子集必须非空:这是定义的一部分,空集不能作为划分中的一块。

- 等价类要么完全相同,要么完全不交:两个等价类 $[a]$ 和 $[b]$,它们的关系只有两种可能:要么 $[a] = [b]$,要么 $[a] \cap [b] = \emptyset$。绝不可能“部分重叠”。

[总结]

等价关系自然地将集合“切”成若干个等价类,每个等价类都聚集了所有相互等价的元素。这些等价类作为整体,形成对原集合的一个划分——即一种不重不漏的分割。

[存在目的]

这两个概念揭示了等价关系的核心作用。我们定义等价关系,根本目的就是为了获得其产生的划分。而由所有等价类构成的集合,被称为商集 (Quotient Set),记作 $A/\sim$。在商集上定义运算,是抽象代数中从已知结构(如整数环 $\mathbb{Z}$)构造新结构(如模n的整数环 $\mathbb{Z}_n$)的根本大法。

[直觉心智模型]

- 等价类:还是用积木分类的例子,等价关系是“颜色相同”。等价类就是一个个的篮子,比如“红色积木篮”、“蓝色积木篮”。

- 代表元:为了指代“红色积木篮”,你可以从里面随便拿一个红色的积木出来,指着它说“就是这个颜色的那一篮”。你拿出来的是哪个积木不重要,它都代表了“红色”这一类。

- 划分:所有这些装有不同颜色积木的篮子放在一起,就构成了对你全部积木的一个分类方案,这就是划分。所有积木都被分到某个篮子里了(不漏),而且没有一个积木同时在两个篮子里(不重)。


1.1.8 命题2:等价关系与划分的等价性

[原文]

命题 2。设 $A$ 是一个非空集合

(1) 如果 $\sim$ 定义了 $A$ 上的等价关系,则 $\sim$ 的等价类构成 $A$ 的一个划分

(2) 如果 $\left\{A_{i} \mid i \in I\right\}$ 是 $A$ 的一个划分,则 $A$ 上存在一个等价关系,其等价类恰好是集合 $A_{i}, i \in I$。

证明:略。

[逐步解释]

这个命题正式阐述了一个深刻的对应关系:等价关系和划分是一枚硬币的两面

1. Part (1): 等价关系 $\Rightarrow$ 划分

* 这部分说,只要你有一个等价关系,你就可以用它来生成一个划分。

* 如何生成:这个划分就是由该等价关系的所有不同的等价类组成的集合。

* 我们在前面的例子中已经验证了这一点:模3同余关系生成了 $\{[0], [1], [2]\}$ 这个划分。

* 证明思路:需要证明两点:(a) 所有等价类的并集是全集(因为每个元素至少和自己等价,所以每个元素都属于某个等价类);(b) 任意两个不同的等价类不相交(通过反证法,如果它们有共同元素,利用对称性和传递性可以证明它们是同一个等价类)。

2. Part (2): 划分 $\Rightarrow$ 等价关系

* 这部分说,反过来,只要你先把一个集合划分成若干小块,你就可以根据这个划分来定义一个等价关系。

* 如何定义:定义关系 $\sim$ 如下:$a \sim b$ 当且仅当 $a$ 和 $b$ 属于划分中的同一个小块 $A_i$。

* 证明思路:需要证明这样定义的关系满足三条性质:

- 自反性:$a \sim a$?因为 $a$ 总和自己在同一个块里。成立。

- 对称性:若 $a, b$ 在同一个块,则 $b, a$ 也在同一个块。成立。

- 传递性:若 $a, b$ 在同一个块 $A_i$, $b, c$ 在同一个块 $A_j$。因为划分的块之间不相交,而 $b$ 同时在 $A_i$ 和 $A_j$ 中,所以必然 $A_i = A_j$。因此 $a,c$ 也在同一个块里。成立。

* 这个关系产生的等价类,正好就是你一开始给出的那些划分块 $A_i$。

[具体数值示例(至少1个,建议≥2个)]

从划分到等价关系

- 设集合 $A = \{1, 2, 3, 4, 5, 6\}$。

- 给定一个划分 $P = \{ \{1, 5\}, \{2, 3, 6\}, \{4\} \}$。

- 根据这个划分定义等价关系 $\sim$:当 $x, y$ 在同一个子集里时,$x \sim y$。

- 关系

- $1 \sim 5$ 且 $5 \sim 1$。

- $2 \sim 3, 2 \sim 6, 3 \sim 6$ (以及它们对称和传递闭包下的所有关系)。

- $4 \sim 4$。

- 例如,$1 \not\sim 2$ 因为它们不在同一个块里。

- 这个关系产生的等价类是什么?

- $[1] = \{x \in A \mid x \sim 1\} = \{1, 5\}$。

- $[2] = \{x \in A \mid x \sim 2\} = \{2, 3, 6\}$。

- $[4] = \{x \in A \mid x \sim 4\} = \{4\}$。

- 结论:产生的等价类集合正是我们开始时给定的划分 $P$。

[总结]

命题2建立了等价关系和划分之间的一一对应关系。给出一个等价关系,就能唯一确定一个划分;反之,给出一个划分,也能唯一确定一个等价关系。它们是描述同一件事情的两种不同语言。

[存在目的]

这个命题是整个商集理论的合法性基石。它告诉我们,当我们谈论“把集合按某种等价标准分类”时,我们既可以从“关系”的角度出发,也可以从“分割”的角度出发,两者是完全等价的,可以根据哪个更方便就用哪个。这为我们后续构造商群等结构时,在等价类和它的代表元之间进行操作提供了理论保障。

[直觉心智模型]

- 硬币的两面

- 正面(等价关系):你有一套规则,告诉你哪些东西是“一样”的(例如,“颜色相同”)。

- 反面(划分):你有一堆分好类的篮子

- 命题2说:你可以通过规则,把东西分到篮子里去。也可以看着分好的篮子,反推出当初分类的规则是“在同一个篮子里的东西就是一样的”。这两个操作是互逆的。


1.1.9 归纳法

[原文]

最后,我们将假设读者熟悉归纳法证明

[逐步解释]

这句话是一个声明,作者将不再详细解释数学归纳法,并默认读者已经掌握了它。

数学归纳法 (Proof by Induction) 是一种用来证明关于自然数(或正整数)的命题 $P(n)$ 对所有 $n \ge n_0$ 都成立的证明方法。

它通常包含两个步骤:

1. 基础步骤 (Base Case):证明命题对于起始值成立。即证明 $P(n_0)$ 是真的。通常 $n_0=0$ 或 $n_0=1$。

2. 归纳步骤 (Inductive Step):证明如果命题对某个任意的 $k$ 成立,那么它也必然对下一个值 $k+1$ 成立。即证明 “如果 $P(k)$ 为真,则 $P(k+1)$ 也为真” 这个蕴含关系。

* 在这个证明中,我们假设 $P(k)$ 为真,这个假设被称为归纳假设 (Inductive Hypothesis)

如果这两个步骤都完成了,那么根据多米诺骨牌效应,命题对所有大于等于 $n_0$ 的自然数都成立。因为 $P(n_0)$ 真 $\implies P(n_0+1)$ 真 $\implies P(n_0+2)$ 真,以此类推。

[具体数值示例(至少1个,建议≥2个)]

命题:证明对于所有正整数 $n \ge 1$,都有 $1+2+3+\ldots+n = \frac{n(n+1)}{2}$。

令 $P(n)$ 为 "$1+2+...+n = \frac{n(n+1)}{2}$"。

证明

1. 基础步骤:当 $n=1$ 时。

- 左边 = $1$。

- 右边 = $\frac{1(1+1)}{2} = \frac{2}{2} = 1$。

- 左边 = 右边,所以 $P(1)$ 成立。

2. 归纳步骤:假设对于某个正整数 $k \ge 1$,$P(k)$ 成立。

- 归纳假设:$1+2+3+\ldots+k = \frac{k(k+1)}{2}$。

- 目标:我们需要证明 $P(k+1)$ 也成立,即证明 $1+2+3+\ldots+k+(k+1) = \frac{(k+1)((k+1)+1)}{2} = \frac{(k+1)(k+2)}{2}$。

- 推导

- 从 $P(k+1)$ 的左边开始:

$1+2+3+\ldots+k+(k+1)$

- 根据归纳假设,我们可以把前 $k$ 项替换掉:

$= (\frac{k(k+1)}{2}) + (k+1)$

- 通分,合并:

$= \frac{k(k+1) + 2(k+1)}{2}$

- 提取公因式 $(k+1)$:

$= \frac{(k+1)(k+2)}{2}$

- 这正是我们想要证明的 $P(k+1)$ 的右边。

- 结论:由于基础步骤和归纳步骤都已完成,根据数学归纳法,该命题对所有正整数 $n \ge 1$ 成立。

[易错点与边界情况]

- 忘记基础步骤:归纳步骤本身只能证明“如果一张牌倒了,下一张也会倒”,但如果没有推倒第一张牌,那什么都不会发生。

- 归纳步骤的逻辑混乱:在归纳步骤中,我们不能直接假设 $P(k+1)$ 成立,而是要从已知的 $P(k)$ 出发,通过逻辑推导,得到 $P(k+1)$。

- 强归纳法:有时,为了证明 $P(k+1)$,仅假设 $P(k)$ 成立是不够的,我们需要假设从 $P(n_0)$ 到 $P(k)$ 所有的都成立。这种形式称为强归纳法,它与普通归纳法是等价的。

[总结]

作者声明,数学归纳法是进行后续学习所需的一项预备技能,本书将直接使用它而不作解释。

[存在目的]

在代数中,许多关于整数、多项式次数、矩阵大小等与自然数相关的命题,都需要用归纳法来证明。例如,证明二项式定理、证明关于置换的某些性质、证明与有限群阶相关的定理等。这是一个基础且强大的证明工具。

[直觉心智模型]

- 多米诺骨牌

- 基础步骤:你亲手推倒了第一张骨牌。

- 归纳步骤:你证明了,任意一张骨牌倒下,都必定会撞倒它的下一张(因为它们摆放得足够近)。

- 结论:整排骨牌都会倒下。


2 练习

2.1 练习 1-4 背景

[原文]

在练习 1 到 4 中,设 $\mathcal{A}$ 是具有实数项的 $2 \times 2$ 矩阵集合。回顾矩阵乘法定义为

$$ \left(\begin{array}{ll} a & b \\ c & d \end{array}\right)\left(\begin{array}{ll} p & q \\ r & s \end{array}\right)=\left(\begin{array}{ll} a p+b r & a q+b s \\ c p+d r & c q+d s \end{array}\right) $$

$$ M=\left(\begin{array}{ll} 1 & 1 \\ 0 & 1 \end{array}\right) $$

并设

$$ \mathcal{B}=\{X \in \mathcal{A} \mid M X=X M\} 。 $$

[逐步解释]

这部分为接下来的4个练习题设置了统一的背景。

1. 全集 $\mathcal{A}$:这是我们讨论的“宇宙”。它包含了所有 $2 \times 2$ 尺寸的,且其四个元素 $a,b,c,d$ 都是实数的矩阵。

2. 矩阵乘法:复习了 $2 \times 2$ 矩阵乘法的规则。第一个矩阵的行,乘以第二个矩阵的列,然后相加。例如,结果中左上角的元素 $(ap+br)$,是用第一个矩阵的第一行 $(a, b)$ 和第二个矩阵的第一列 $(p, r)$ 计算得到的。

3. 特殊矩阵 $M$:在所有 $2 \times 2$ 矩阵中,挑选出了一个具体的矩阵 $M=\left(\begin{array}{ll} 1 & 1 \\ 0 & 1 \end{array}\right)$ 作为参考。

4. 子集 $\mathcal{B}$:这是练习的核心研究对象。它是 $\mathcal{A}$ 的一个子集,使用了我们之前学过的集合构建范式来定义。

* 一个矩阵 $X$ 要想成为 $\mathcal{B}$ 的成员,它首先必须是 $\mathcal{A}$ 的成员(即一个 $2 \times 2$ 实数矩阵)。

* 其次,它必须满足一个条件:$MX=XM$。

* $MX=XM$ 这个条件意味着矩阵 $X$ 与矩阵 $M$ 的乘法是可交换的 (commute)

* 通常,矩阵乘法是不可交换的,即 $AB \neq BA$。所以,$\mathcal{B}$ 是所有那些能与 $M$ 交换的特殊矩阵的集合。这个集合在代数上称为 $M$ 的中心化子 (centralizer)

[公式与符号逐项拆解和推导(若本段含公式)]

$$ \left(\begin{array}{ll} a & b \\ c & d \end{array}\right)\left(\begin{array}{ll} p & q \\ r & s \end{array}\right)=\left(\begin{array}{ll} a p+b r & a q+b s \\ c p+d r & c q+d s \end{array}\right) $$

- 结果矩阵的 (1,1) 位置 (第一行, 第一列): $a p+b r$

- 取左边矩阵的第1行 $(a, b)$。

- 取右边矩阵的第1列 $\left(\begin{array}{l}p \\ r\end{array}\right)$。

- 对应元素相乘再相加: $a \times p + b \times r$。

- 结果矩阵的 (1,2) 位置 (第一行, 第二列): $a q+b s$

- 取左边矩阵的第1行 $(a, b)$。

- 取右边矩阵的第2列 $\left(\begin{array}{l}q \\ s\end{array}\right)$。

- 对应元素相乘再相加: $a \times q + b \times s$。

- 结果矩阵的 (2,1) 位置 (第二行, 第一列): $c p+d r$

- 取左边矩阵的第2行 $(c, d)$。

- 取右边矩阵的第1列 $\left(\begin{array}{l}p \\ r\end{array}\right)$。

- 对应元素相乘再相加: $c \times p + d \times r$。

- 结果矩阵的 (2,2) 位置 (第二行, 第二列): $c q+d s$

- 取左边矩阵的第2行 $(c, d)$。

- 取右边矩阵的第2列 $\left(\begin{array}{l}q \\ s\end{array}\right)$。

- 对应元素相乘再相加: $c \times q + d \times s$。

[总结]

练习1-4要求我们研究能与特定矩阵 $M$ 进行交换乘法的 $2 \times 2$ 矩阵所构成的集合 $\mathcal{B}$ 的性质。


2.2 练习 1

[原文]

1. 确定以下 $\mathcal{A}$ 中的哪些元素在 $\mathcal{B}$ 中:

$$ \left(\begin{array}{ll} 1 & 1 \\ 0 & 1 \end{array}\right),\left(\begin{array}{ll} 1 & 1 \\ 1 & 1 \end{array}\right),\left(\begin{array}{ll} 0 & 0 \\ 0 & 0 \end{array}\right),\left(\begin{array}{ll} 1 & 1 \\ 1 & 0 \end{array}\right),\left(\begin{array}{ll} 1 & 0 \\ 0 & 1 \end{array}\right),\left(\begin{array}{ll} 0 & 1 \\ 1 & 0 \end{array}\right) 。 $$

[逐步解释]

这个练习要求我们逐个检查给定的6个矩阵,判断它们是否满足加入集合 $\mathcal{B}$ 的条件,即 $MX=XM$。

我们的 $M = \left(\begin{array}{ll} 1 & 1 \\ 0 & 1 \end{array}\right)$。

对于每个给定的矩阵 $X$,我们都需要计算 $MX$ 和 $XM$,然后比较结果是否相等。

1. $X = \left(\begin{array}{ll} 1 & 1 \\ 0 & 1 \end{array}\right)$ (就是 M 本身)

- $MX = M M = \left(\begin{array}{ll} 1 & 1 \\ 0 & 1 \end{array}\right)\left(\begin{array}{ll} 1 & 1 \\ 0 & 1 \end{array}\right) = \left(\begin{array}{ll} 1\cdot1+1\cdot0 & 1\cdot1+1\cdot1 \\ 0\cdot1+1\cdot0 & 0\cdot1+1\cdot1 \end{array}\right) = \left(\begin{array}{ll} 1 & 2 \\ 0 & 1 \end{array}\right)$。

- $XM = M M = \left(\begin{array}{ll} 1 & 2 \\ 0 & 1 \end{array}\right)$。

- $MX=XM$,所以 $\left(\begin{array}{ll} 1 & 1 \\ 0 & 1 \end{array}\right) \in \mathcal{B}$。 (任何矩阵都与自身可交换)

2. $X = \left(\begin{array}{ll} 1 & 1 \\ 1 & 1 \end{array}\right)$

- $MX = \left(\begin{array}{ll} 1 & 1 \\ 0 & 1 \end{array}\right)\left(\begin{array}{ll} 1 & 1 \\ 1 & 1 \end{array}\right) = \left(\begin{array}{ll} 1\cdot1+1\cdot1 & 1\cdot1+1\cdot1 \\ 0\cdot1+1\cdot1 & 0\cdot1+1\cdot1 \end{array}\right) = \left(\begin{array}{ll} 2 & 2 \\ 1 & 1 \end{array}\right)$。

- $XM = \left(\begin{array}{ll} 1 & 1 \\ 1 & 1 \end{array}\right)\left(\begin{array}{ll} 1 & 1 \\ 0 & 1 \end{array}\right) = \left(\begin{array}{ll} 1\cdot1+1\cdot0 & 1\cdot1+1\cdot1 \\ 1\cdot1+1\cdot0 & 1\cdot1+1\cdot1 \end{array}\right) = \left(\begin{array}{ll} 1 & 2 \\ 1 & 2 \end{array}\right)$。

- $MX \neq XM$,所以 $\left(\begin{array}{ll} 1 & 1 \\ 1 & 1 \end{array}\right) \notin \mathcal{B}$。

3. $X = \left(\begin{array}{ll} 0 & 0 \\ 0 & 0 \end{array}\right)$ (零矩阵 O)

- $MX = \left(\begin{array}{ll} 1 & 1 \\ 0 & 1 \end{array}\right)\left(\begin{array}{ll} 0 & 0 \\ 0 & 0 \end{array}\right) = \left(\begin{array}{ll} 0 & 0 \\ 0 & 0 \end{array}\right)$。

- $XM = \left(\begin{array}{ll} 0 & 0 \\ 0 & 0 \end{array}\right)\left(\begin{array}{ll} 1 & 1 \\ 0 & 1 \end{array}\right) = \left(\begin{array}{ll} 0 & 0 \\ 0 & 0 \end{array}\right)$。

- $MX=XM$,所以 $\left(\begin{array}{ll} 0 & 0 \\ 0 & 0 \end{array}\right) \in \mathcal{B}$。 (任何矩阵与零矩阵的乘积都是零矩阵,所以可交换)

4. $X = \left(\begin{array}{ll} 1 & 1 \\ 1 & 0 \end{array}\right)$

- $MX = \left(\

好的,我将根据您提供的 Abstract Algebra Third Edition David Ch0.1.ZH.md 的内容,并严格遵循 解释工作流WorkFlow.md 文件中定义的工作流程,为您生成一份详尽、完整、无删减的解释。解释内容将一次性在本次回复中完整提供,不会截断或省略。

1 预备知识

1.1 引言

📜 [原文1]

本章收集了文本中通篇使用的一些结果和符号,以方便查阅。学生们可以先快速浏览本章,然后随着概念在文本中的出现,再次更仔细地阅读每个部分。

📖 [逐步解释]

这部分是全书的引言章节的开篇说明。作者明确指出,这一章(第0章)扮演着一个“速查手册”或“工具箱”的角色。它包含了后续章节会频繁用到的基础数学概念、符号和结论。作者给出了学习建议:

  1. 初次阅读:可以像看目录一样快速地过一遍,对将要涉及的基础知识有一个大概的印象,了解本书依赖哪些“预备技能”。你不需要在第一遍就完全掌握所有细节。
  2. 深入学习:在学习后面章节的过程中,如果遇到了本章提到的某个概念(比如一个符号、一个定义或一个定理),你需要返回到这一章,进行更深入、更仔细的阅读和理解。这是一种“即用即查”的学习方式。

这种安排的目的是为了让读者在进入抽象代数的核心内容之前,确保大家对基础语言和工具有一个统一的认识,避免因为基础知识的生疏而阻碍对新概念的理解。

📝 [总结]

本段是第0章的引言,说明了本章作为全书基础知识和符号的参考手册的功能,并建议读者采用“先浏览,后精读”的学习策略。

🎯 [存在目的]

本段的目的是为读者设定正确的学习预期,告知他们本章内容的性质和学习方法。它帮助读者建立一个高效的学习路径,避免在基础知识上花费过多不必要的时间,同时又能在需要时快速找到参考。

🧠 [直觉心智模型]

你可以把这一章想象成一本字典或者游戏开始前的“新手教程”。在玩一个复杂的游戏之前,教程会快速告诉你基本操作(移动、跳跃、攻击),但你只有在实际遇到需要这些操作的关卡时,才会真正去熟练掌握它们。本章就是这本“数学词典”和“新手教程”,为后续的“游戏关卡”(抽象代数的正式内容)做准备。

💭 [直观想象]

想象你准备去一个陌生的国家探险。出发前,你会拿到一本小册子,上面写着这个国家的基本用语(你好、谢谢)、货币符号(¥, $, €)、地图图例(---代表公路,▲代表山峰)等。你可能不会立刻背下所有内容,但你会知道有这本册子存在。当你在这个国家探险时,看到一个不认识的路标,或者想买东西时,你就会翻开这本册子查找对应的信息。本章就是你在“抽象代数王国”探险前拿到的那本关键信息小册子。

2 基础知识

2.1 集合论基础

📜 [原文2]

读者应该熟悉集合论的基础知识:集合、$\cap, \cup, \in$ 等。我们对给定集合 $A$ 的子集的表示法如下:

$$ B=\{a \in A \mid \ldots(\text { 对 } a \text { 的条件 }) \ldots\} 。 $$

集合 $A$ 的基数将用 $|A|$ 表示。如果 $A$ 是一个有限集合,则 $A$ 的就是 $A$ 中元素的数量。

理解如何测试特定的 $x \in A$ 是否位于 $A$ 的子集 $B$ 中(参见练习 1-4)非常重要。两个集合 $A$ 和 $B$ 的笛卡尔积有序对集合 $A \times B=\{(a, b) \mid a \in A, b \in B\}$,其中元素来自 $A$ 和 $B$。

📖 [逐步解释]

这部分开始复习集合论(Set Theory)的基本概念,这是现代数学的通用语言。

  1. 基本概念:作者假设读者已经了解最基本的几个概念:
    • 集合 (Set):一堆明确区分的事物的总体。例如,$\{1, 2, 3\}$ 是一个包含三个数字的集合。
    • 交集 (Intersection, $\cap$):两个集合共有的元素组成的集合。例如,$\{1, 2\} \cap \{2, 3\} = \{2\}$。
    • 并集 (Union, $\cup$):两个集合所有元素合并在一起组成的集合。例如,$\{1, 2\} \cup \{2, 3\} = \{1, 2, 3\}$。
    • 属于 (Element of, $\in$):表示一个元素是某个集合的成员。例如,$2 \in \{1, 2, 3\}$ 表示 2 是集合 $\{1, 2, 3\}$ 中的一个元素。
  2. 子集的表示法:这里介绍了一种非常重要且通用的符号,叫做“集合构建符号”(Set-builder notation)。
    • B = { ... } 表示 B 是一个集合。
    • a ∈ A 表示 B 中的元素 a 都必须首先是集合 A 中的元素。这说明 B 是 A 的一个子集(Subset)。
    • | 这个竖线读作“使得”(such that),它后面跟着的是筛选条件。
    • ... (对 a 的条件) ... 表示一个逻辑判断,只有满足这个条件的元素 a 才能被放入集合 B。
    • 所以,整个表达式的含义是:“B 是由所有那些属于集合 A 且满足特定条件的元素 a 所组成的集合”。
  3. 阶 (Order) 或 基数 (Cardinality)
    • 符号 $|A|$ 用来表示集合 $A$ 的大小。
    • 对于有限集合(finite set),$|A|$ 就是集合里元素的个数。比如,如果 $A = \{a, b, c\}$,那么 $|A| = 3$。
    • 对于无限集合(infinite set),比如所有整数的集合 $\mathbb{Z}$,它的基数是无限的,表示为 $|\mathbb{Z}| = \infty$ 或者更精确地用阿列夫数 $\aleph_0$ 表示。在初等抽象代数中,我们通常更关心有限集合的阶。
  4. 检验成员资格 (Membership Testing)
    • 这是一个非常核心的实践技能。给你一个元素 $x$ 和一个用集合构建符号定义的子集 $B = \{a \in A \mid P(a)\}$(这里 $P(a)$ 代表“对 a 的条件”),你需要能够判断 $x$ 是否属于 $B$。
    • 判断过程分为两步:
  5. 检查 $x$ 是否属于父集 $A$?如果不是,那么 $x$ 肯定不属于 $B$。
  6. 如果 $x$ 属于 $A$,再检查 $x$ 是否满足条件 $P(a)$?如果满足,那么 $x \in B$;如果不满足,则 $x \notin B$。
    • 作者在这里通过引用练习 1-4 来强调这一点的重要性,说明这不仅仅是理论,更是需要动手操作的能力。
  7. 笛卡尔积 (Cartesian Product)
    • $A \times B$ 表示集合 $A$ 和集合 $B$ 的笛卡尔积。
    • 它的元素不是单个的对象,而是有序对(ordered pair)$(a, b)$。
    • 有序对的第一个分量 $a$ 必须来自集合 $A$,第二个分量 $b$ 必须来自集合 $B$。
    • “有序”是关键,意味着 $(a, b)$ 和 $(b, a)$ 是不同的,除非 $a=b$ 且 $A$ 和 $B$ 是同一个集合。
∑ [公式拆解]

公式:

$$ B=\{a \in A \mid \ldots(\text { 对 } a \text { 的条件 }) \ldots\} 。 $$

  • B: 我们正在定义的新集合的名称。
  • =: 等于号,表示定义。
  • { }: 花括号,表示这是一个集合。
  • a: 一个变量,代表集合中的一个典型元素。你可以把它看作一个占位符。
  • : “属于”符号,表示“是...中的一个元素”。
  • A: 父集,即元素 $a$ 的来源范围。
  • |: “使得”符号,分隔了元素的来源和筛选条件。
  • ... (对 a 的条件) ...: 一个逻辑谓词(predicate),即一个关于 $a$ 的陈述句,这个陈述句可以是真或假。只有当 $a$ 使得这个陈述为真时,它才被包含在集合 $B$ 中。
💡 [数值示例]
  • 示例1:子集表示法
  • 设父集为整数集合 $\mathbb{Z} = \{..., -2, -1, 0, 1, 2, ...\}$。
  • 我们想定义一个子集 $E$,包含所有偶数。
  • 使用集合构建符号,我们可以写成:$E = \{x \in \mathbb{Z} \mid x \text{ 是 2 的倍数}\}$。
  • 更数学化的写法是:$E = \{x \in \mathbb{Z} \mid \exists k \in \mathbb{Z}, x = 2k\}$。(这里 $\exists$ 表示“存在”)
  • 现在来检验成员资格
  • 测试 4:Is $4 \in E$?
  1. $4 \in \mathbb{Z}$? 是的。
  2. $4$ 是 2 的倍数吗? 是的,$4 = 2 \times 2$。所以 $4 \in E$。
    • 测试 3:Is $3 \in E$?
  3. $3 \in \mathbb{Z}$? 是的。
  4. $3$ 是 2 的倍数吗? 不是。所以 $3 \notin E$。
  • 示例2:阶/基数
  • 设 $A = \{1, \text{apple}, \pi\}$。这是一个有限集合。
  • $A$ 的阶是 $|A| = 3$。
  • 设 $B = \{x \in \mathbb{Z} \mid 1 \le x \le 5\} = \{1, 2, 3, 4, 5\}$。
  • $B$ 的阶是 $|B| = 5$。
  • 示例3:笛卡尔积
  • 设 $A = \{1, 2\}$ 和 $B = \{a, b, c\}$。
  • $A \times B$ 的所有元素都是形如 $(x, y)$ 的有序对,其中 $x \in A, y \in B$。
  • $A \times B = \{ (1, a), (1, b), (1, c), (2, a), (2, b), (2, c) \}$。
  • 注意 $|A \times B| = |A| \times |B| = 2 \times 3 = 6$。
  • 同时,$B \times A = \{ (a, 1), (a, 2), (b, 1), (b, 2), (c, 1), (c, 2) \}$。
  • 可以看到,$A \times B \neq B \times A$。
⚠️ [易错点]
  1. 子集符号混淆:初学者容易混淆 $\in$ (属于) 和 $\subset$ (是...的子集)。
  2. $a \in A$:$a$ 是一个元素,$A$ 是一个集合。
  3. $B \subset A$:$B$ 是一个集合,$A$ 也是一个集合。
  4. 例如,设 $A = \{1, 2, 3\}$。那么 $1 \in A$ 是正确的,但 $\{1\} \in A$ 是错误的。而 $\{1\} \subset A$ 是正确的。
  5. 笛卡尔积的顺序:务必记住笛卡尔积是有序的,$A \times B$ 和 $B \times A$ 通常是不同的集合。它们相等的唯一情况是 $A=B$ 或者其中一个集合是空集。
  6. 空集作为子集:对于任何集合 $A$,空集 $\emptyset$ 都是它的子集,即 $\emptyset \subset A$。
  7. 集合构建的条件:条件必须是明确无误的。例如,$\{x \in \mathbb{R} \mid x \text{ 是一个比较大的数}\}$ 是一个无效的定义,因为“比较大”没有明确的标准。
📝 [总结]

本段复习了集合论的基本语言,包括集合、交、并、属于等符号,重点介绍了使用“集合构建符号”来定义子集的方法,并讲解了集合的阶(基数)和笛卡尔积的概念。

🎯 [存在目的]

本段旨在为全书建立一套统一、精确的数学语言基础。抽象代数的研究对象(群、环、域等)本质上都是带有附加结构的集合。因此,在讨论这些结构之前,必须确保读者对如何描述集合、子集、元素及其关系有清晰无误的理解。

🧠 [直觉心智模型]
  1. 集合构建:想象有一个大仓库 A,里面堆满了各种各样的货物(元素)。你手里有一个清单(条件),你要推着一辆手推车 B,在仓库 A 里挨个检查货物,把符合清单上描述的货物捡到你的手推车 B 里。最终,手推车 B 里的所有货物就构成了子集 B
  2. 笛卡尔积:想象你在一家餐厅点套餐。主食 A 有两种选择:{米饭, 面条}。饮料 B 有三种选择:{可乐, 橙汁, 茶}。那么,你能搭配出的所有套餐组合就是笛卡尔积 $A \times B$。每一种组合都是一个有序对,例如 (米饭, 可乐),(面条, 橙汁) 等。
💭 [直观想象]
  1. 子集:地球(集合 A)上所有的人类。亚洲人(集合 B)就是人类的一个子集。你可以用 $B = \{x \in A \mid x \text{ 居住在亚洲}\}$ 来定义。
  2. 笛卡尔积:想象一个电影院的座位表。行号的集合是 $R = \{1, 2, 3, ..., 20\}$,列号的集合是 $C = \{'A', 'B', 'C', ..., 'K'\}$。那么每一个具体的座位,比如“第5行J座”,就可以表示成一个有序对 $(5, 'J')$,而整个电影院的所有座位就是笛卡尔积 $R \times C$。

2.2 常用数集

📜 [原文3]

我们将使用以下符号表示一些常见的数集

(1) $\mathbb{Z}=\{0, \pm 1, \pm 2, \pm 3, \ldots\}$ 表示整数($\mathbb{Z}$ 是德语“数字”:”Zahlen”的缩写)。

(2) $\mathbb{Q}=\{a / b \mid a, b \in \mathbb{Z}, b \neq 0\}$ 表示有理数(或有理数集)。

(3) $\mathbb{R}=\left\{\right.$ 所有小数展开式 $\left.\pm d_{1} d_{2} \ldots d_{n} . a_{1} a_{2} a_{3} \ldots\right\}$ 表示实数(或实数集)。

(4) $\mathbb{C}=\left\{a+b i \mid a, b \in \mathbb{R}, i^{2}=-1\right\}$ 表示复数

(5) $\mathbb{Z}^{+}、\mathbb{Q}^{+}$和 $\mathbb{R}^{+}$将分别表示 $\mathbb{Z}、\mathbb{Q}$ 和 $\mathbb{R}$ 中的(非零)元素。

📖 [逐步解释]

这部分规定了全书中将要用到的标准数学符号,用来代表几类非常重要的数字集合。这些符号在数学中是高度标准化的。

  1. 整数 (Integers) $\mathbb{Z}$:
    • 这个集合包括了所有的正整数、负整数和零。
    • 例子:..., -3, -2, -1, 0, 1, 2, 3, ...
    • 符号 $\mathbb{Z}$ 来自德语单词 "Zahlen",意思是“数字”。这种字体被称为“黑板粗体”(blackboard bold),在数学中常用来表示重要的数集。
  2. 有理数 (Rational Numbers) $\mathbb{Q}$:
    • 这个集合包含了所有可以表示为两个整数之比的数。
    • 定义使用了上一节的集合构建法:$\{a/b \mid a, b \in \mathbb{Z}, b \neq 0\}$。
    • $a/b$ 是分数形式。
    • $a, b \in \mathbb{Z}$ 表示分子 $a$ 和分母 $b$ 都必须是整数。
    • $b \neq 0$ 是一个至关重要的条件,因为分母不能为零。
    • 符号 $\mathbb{Q}$ 来自 "Quotient",即“商”。
    • 例子:$1/2$, $-3/4$, $5$ (可以写成 $5/1$), $0$ (可以写成 $0/1$)。所有整数都属于有理数。
  3. 实数 (Real Numbers) $\mathbb{R}$:
    • 这个集合包含了所有有理数和无理数(如 $\pi$, $\sqrt{2}$, $e$)。
    • 这里的定义方式比较直观,但不够严格:它被描述为所有可能的小数展开式。
    • $\pm d_{1} d_{2} \ldots d_{n} . a_{1} a_{2} a_{3} \ldots$ 涵盖了:
    • 有限小数(如 1.25)
    • 无限循环小数(如 1/3 = 0.333...)
    • 无限不循环小数(如 $\pi = 3.14159...$)
    • 符号 $\mathbb{R}$ 来自 "Real"。
  4. 复数 (Complex Numbers) $\mathbb{C}$:
    • 这个集合扩展了实数,引入了虚数单位 $i$。
    • 定义使用了集合构建法:$\{a+bi \mid a, b \in \mathbb{R}, i^2 = -1\}$。
    • 一个复数由两部分组成:实部 $a$ 和虚部 $b$,它们都是实数。
    • $i$ 是虚数单位,其定义为 $i^2 = -1$。
    • 例子:$2+3i$, $-5.1i$ (实部为0), $7$ (虚部为0)。所有实数都属于复数。
    • 符号 $\mathbb{C}$ 来自 "Complex"。
  5. 正数子集:
    • 这是一种方便的记法,通过在集合符号右上角加一个 + 号来表示该集合中的正数部分。
    • $\mathbb{Z}^{+}$: 正整数集合 $\{1, 2, 3, ...\}$。注意,这里根据上下文约定,可能包含或不包含0,但文本明确指出是“非零”元素,所以不包含0。这个集合也常被称为自然数集 $\mathbb{N}$(但 $\mathbb{N}$ 是否含0在不同领域有不同约定,使用 $\mathbb{Z}^{+}$ 更明确)。
    • $\mathbb{Q}^{+}$: 所有正有理数的集合,如 $1/2, 5/3$。
    • $\mathbb{R}^{+}$: 所有正实数的集合,如 $0.1, \pi, \sqrt{2}$。

这些集合之间存在着清晰的包含关系(子集关系):

$\mathbb{Z}^{+} \subset \mathbb{Z} \subset \mathbb{Q} \subset \mathbb{R} \subset \mathbb{C}$

💡 [数值示例]
  • $\mathbb{Z}$ (整数): $-100, 0, 42$ 都是整数。$1/2, -3.5$ 不是整数。
  • $\mathbb{Q}$ (有理数):
  • $0.5 = 1/2$,所以 $0.5 \in \mathbb{Q}$。
  • $-7 = -7/1$,所以 $-7 \in \mathbb{Q}$。
  • $0.333... = 1/3$,所以 $0.333... \in \mathbb{Q}$。
  • $\sqrt{2} \approx 1.414...$ 不能表示为两个整数的比,所以 $\sqrt{2} \notin \mathbb{Q}$。
  • $\mathbb{R}$ (实数): $1, 1/2, \sqrt{2}, \pi, -e$ 都是实数。$\sqrt{-1}=i$ 不是实数。
  • $\mathbb{C}$ (复数):
  • $5 + 2i$ 是一个复数,实部是 5,虚部是 2。
  • $10$ 是一个复数,可以写成 $10 + 0i$。
  • $-4i$ 是一个复数,可以写成 $0 - 4i$。
  • $\mathbb{Z}^{+}$ (正整数): $1, 2, 3, 1000$。$0, -1, 1.5$ 都不是正整数。
⚠️ [易错点]
  1. 0 是否为正数: 在本书的约定中,$\mathbb{Z}^{+}$、$\mathbb{Q}^{+}$、$\mathbb{R}^{+}$ 都明确指(positive)且非零(non-zero)的元素。在其他一些数学分支或教材中,“非负”(non-negative)数(包含0)可能用其他符号表示,例如 $\mathbb{R}_{\ge 0}$。要注意上下文的约定。
  2. 有理数的等价性: $1/2$, $2/4$, $-3/-6$ 看起来是不同的分数,但它们代表同一个有理数。这是有理数定义中一个微妙的地方,即一个有理数是分数的一个等价类。
  3. 实数的定义: 用“所有小数展开式”来定义实数是不严格的,因为涉及到无限小数的唯一性问题(例如 $1.000... = 0.999...$)。在更高等的分析课程中,实数会通过戴德金分割或柯西序列来严格构造。但在代数课程中,这种直观的理解足够了。
📝 [总结]

本段定义了将在全书中使用的五个标准数集符号:$\mathbb{Z}$ (整数), $\mathbb{Q}$ (有理数), $\mathbb{R}$ (实数), $\mathbb{C}$ (复数),以及它们的正子集 $\mathbb{Z}^{+}, \mathbb{Q}^{+}, \mathbb{R}^{+}$。

🎯 [存在目的]

目的是标准化符号,确保作者和读者在提到“整数”、“有理数”等基本数学对象时,使用的是同一套语言,避免歧义。这些数集本身也是抽象代数中一些最重要、最典型的研究实例(例如,整数构成一个环,有理数、实数、复数都构成域)。

🧠 [直觉心智模型]

想象一套俄罗斯套娃:

  1. 最小的娃娃是正整数 $\mathbb{Z}^{+}$。
  2. 外面一层套着它的是整数 $\mathbb{Z}$ (多了0和负整数)。
  3. 再外面一层是有理数 $\mathbb{Q}$ (在整数之间填充了所有的分数)。
  4. 再外面一层是实数 $\mathbb{R}$ (把有理数之间的所有“缝隙”都用无理数填满了,形成一条连续的数轴)。
  5. 最大的一层是复数 $\mathbb{C}$ (从一维的数轴扩展到了一个二维的复平面)。
💭 [直观想象]
  1. $\mathbb{Z}$ 就像一条公路上每一公里的里程碑。
  2. $\mathbb{Q}$ 就像在这条公路上,不仅有里程碑,还有所有可以精确标记出来的分数位置(比如1.5公里,2.75公里等)。
  3. $\mathbb{R}$ 就是整条连续不断的公路本身,包含了所有点,无论能不能用分数精确标出。
  4. $\mathbb{C}$ 就像是公路所在的整个平面地图,任何一个点(比如“东经3,北纬5”)都有一个坐标。

2.3 函数基础

📜 [原文4]

我们将使用符号 $f: A \rightarrow B$ 或 $A \xrightarrow{f} B$ 来表示从 $A$ 到 $B$ 的函数 $f$,并且 $f$ 在 $a$ 处的值表示为 $f(a)$(即,我们将所有函数应用到左侧)。函数映射这两个词我们可互换使用。集合 $A$ 称为 $f$ 的定义域,而 $B$ 称为 $f$ 的上域。如果 $f$ 是已知的,则符号 $f: a \mapsto b$ 或 $a \mapsto b$ 表示 $f(a)=b$,即函数在元素上被指定。

📖 [逐步解释]

这部分开始复习函数(Function)或映射(Mapping)的核心概念和符号。

  1. 函数表示法:
    • $f: A \rightarrow B$ 是标准表示法。它传达了三个核心信息:
  2. 函数的名称是 $f$。
  3. 函数的输入来自集合 $A$。
  4. 函数的输出将落在集合 $B$ 中。
    • $A \xrightarrow{f} B$ 是另一种等价的写法,视觉上更像一个箭头把 $A$ 中的元素“射”向 $B$。
  5. 函数求值:
    • $f(a)$ 表示将函数 $f$ 应用于其定义域中的一个具体元素 $a$ 所得到的结果。
    • 作者特意提到“我们将所有函数应用到左侧”,意思是函数名写在变量的左边,如 $f(x)$。这是最常见的写法。在某些特定领域(如某些编程语言或组合数学的旧习惯),偶尔也会看到 $x.f$ 或 $xf$ 这样的“应用在右侧”的写法,但本书统一使用标准写法。
  6. 术语:
    • 函数(Function) vs 映射(Mapping): 在本书中,这两个词是同义词,可以互换使用。在某些更专门的领域,它们可能有细微差别,但在这里不用担心。
    • 定义域 (Domain): 集合 $A$,即函数可以接受的所有合法输入的集合。
    • 上域 (Codomain): 集合 $B$,即函数所有可能的输出值所在的集合。注意:这不等于函数实际的输出值集合,实际输出的集合是上域的一个子集。
  7. 元素级别的映射表示:
    • $f: a \mapsto b$ 或 $a \mapsto b$ 这种带有一个小竖杠的箭头 读作 "maps to"。
    • 它精确地描述了函数对单个元素的作用,而不是像 那样描述整个集合之间的关系。
    • $a \mapsto b$ 是 $f(a)=b$ 的另一种写法,当你想在定义函数时强调其对应法则时非常有用。
💡 [数值示例]
  • 示例1
  • 考虑一个函数 $f$,它将一个整数映射到它的平方。
  • 集合表示: $f: \mathbb{Z} \rightarrow \mathbb{Z}$。
  • 定义域: $\mathbb{Z}$ (所有整数)
  • 上域: $\mathbb{Z}$ (所有整数)
  • 法则: 对于任意整数 $x$, $f(x) = x^2$。
  • 求值: $f(2) = 2^2 = 4$。$f(-3) = (-3)^2 = 9$。
  • 元素级别表示: 我们可以写成 $x \mapsto x^2$。
  • 示例2
  • 设 $A = \{1, 2, 3\}$ 和 $B = \{\text{red}, \text{green}, \text{blue}\}$。
  • 定义一个函数 $g: A \rightarrow B$ 如下:
  • $g(1) = \text{red}$
  • $g(2) = \text{green}$
  • $g(3) = \text{red}$
  • 定义域: $A = \{1, 2, 3\}$
  • 上域: $B = \{\text{red}, \text{green}, \text{blue}\}$
  • 我们可以用元素级别的映射来描述这个函数:
  • $1 \mapsto \text{red}$
  • $2 \mapsto \text{green}$
  • $3 \mapsto \text{red}$
⚠️ [易错点]
  1. 定义域中的每个元素必须有唯一的输出: 一个合法的函数必须为定义域中的每一个元素都指定一个且仅一个输出。
  2. 错误示例1 (没有全覆盖): 设 $f: \{1, 2, 3\} \rightarrow \{a, b\}$ 定义为 $f(1)=a, f(2)=b$。这是不合法的,因为没有定义 $f(3)$。
  3. 错误示例2 (输出不唯一): 设 $f: \{1, 2\} \rightarrow \{a, b\}$ 定义为 $f(1)=a$ 且 $f(1)=b$ (假设$a \neq b$)。这也是不合法的,因为元素 1 对应了两个不同的输出。
  4. 上域 (Codomain) vs 值域 (Range): 这是最常见的混淆点。
  5. 上域是声明的“目标靶场”,是函数输出可能存在的地方。
  6. 值域是实际上射中的点的集合。
  7. 在上面的示例2中,上域是 $B = \{\text{red}, \text{green}, \text{blue}\}$,但实际的输出只有 redgreen。所以值域是 $\{\text{red}, \text{green}\}$。值域永远是上域的一个子集。
📝 [总结]

本段规定了函数(或映射)的表示方法 $f: A \rightarrow B$,明确了定义域和上域的概念,并介绍了用于描述具体元素对应关系的符号 $a \mapsto b$。

🎯 [存在目的]

函数是抽象代数的核心工具。群、环、域之间的关系(如同态同构)都是通过函数来定义的。因此,在开始之前,必须对函数是什么、如何表示它、以及相关的术语有一个清晰、统一的理解。

🧠 [直觉心智模型]

想象一个自动售货机 f

  1. 定义域 A: 是这台机器接受的所有硬币类型,比如 {一角, 五角, 一元}。你不能投入一张纸币或者一个游戏币。
  2. 上域 B: 是这台机器商品出口可能出现的所有商品种类,比如 {可乐, 薯片, 巧克力, 矿泉水}。这是机器设计时就规定好的。
  3. 函数法则 $f(x)$: 投币和出货之间的对应规则。比如,投入“一元”,出来“可乐”。我们可以写成 $f(\text{一元}) = \text{可乐}$,或者 $\text{一元} \mapsto \text{可乐}$。
  4. 值域: 假设今天巧克力卖完了,那么你无论投什么币,都不可能得到巧克力。那么今天的值域就是 {可乐, 薯片, 矿泉水},它只是上域的一个子集。
💭 [直观想象]

想象一个弓箭手在射箭。

  1. 定义域 A: 是他箭袋里所有的箭(比如有5支箭,编号1到5)。
  2. 上域 B: 是他面前的整个靶子(一个圆形区域)。
  3. 函数 f: 就是弓箭手的一次射击活动。他必须把箭袋里的每一支箭都射出去。
  4. $f(a)=b$: 表示“编号为 a 的箭射中了靶子上的 b 点”。
  5. 这个过程必须是确定的,一支箭不能同时射中两个点。
  6. 值域: 靶子上所有中箭的点组成的集合。可能他射术不精,所有箭都偏到左下角,那么值域就是左下角那一小块区域,而不是整个靶子(上域)。

2.4 函数的良定义性

📜 [原文5]

如果函数 $f$ 未在元素上指定,通常检查 $f$ 是否良好定义(well defined),即是否被明确确定,这一点很重要。例如,如果集合 $A$ 是两个子集 $A_{1}$ 和 $A_{2}$ 的并集,那么可以通过声明 $f$ 将 $A_{1}$ 中的所有内容映射到 0,并将 $A_{2}$ 中的所有内容映射到 1,来尝试指定一个从 $A$ 到集合 $\{0,1\}$ 的函数。除非 $A_{1}$ 和 $A_{2}$ 有共同的元素(在这种情况下,不清楚这些元素应该映射到 0 还是 1),否则这会明确定义 $f$。因此,检查这个 $f$ 是否良好定义,就相当于检查 $A_{1}$ 和 $A_{2}$ 没有交集

📖 [逐步解释]

这部分引入了一个在抽象代数中极其重要的概念:良定义性 (Well-definedness)

一个函数是“良好定义”的,意味着它的定义是清晰、无歧义的。具体来说,要满足两个条件:

  1. 存在性 (Existence): 定义域中的每个元素都必须有一个输出。
  2. 唯一性 (Uniqueness): 定义域中的每个元素都只能有一个输出。

这个概念什么时候变得特别重要呢?当函数的输入(定义域的元素)本身可以用多种方式表示时。

比如,在定义有理数上的函数时,输入是 $a/b$,但我们知道 $1/2$ 和 $2/4$ 是同一个有理数。如果你的函数定义依赖于分子和分母的具体数值,你就必须检查,当输入是 $1/2$ 时和输入是 $2/4$ 时,你的函数是否给出了相同的输出。如果输出不同,那么这个函数就不是“良好定义”的,因为它对于同一个输入的两种不同表示给出了矛盾的结果。

作者给出的例子阐述了“唯一性”的问题:

  • 场景: 我们有一个集合 $A = A_1 \cup A_2$。
  • 尝试定义函数: $f: A \rightarrow \{0, 1\}$,规则是:
  • 如果 $x \in A_1$,那么 $f(x)=0$。
  • 如果 $x \in A_2$,那么 $f(x)=1$。
  • 潜在问题: 如果有一个元素 $x$ 同时存在于 $A_1$ 和 $A_2$ 中(即 $x \in A_1 \cap A_2$),那么根据第一条规则,$f(x)$ 应该是 0;而根据第二条规则,$f(x)$ 又应该是 1。这就产生了矛盾:同一个输入 $x$ 对应了两个不同的输出(0 和 1)。
  • 结论: 这样的函数定义是不明确的,是“非良定义”(ill-defined)的。
  • 如何修正: 要使这个函数是“良好定义”的,我们必须确保这种情况不会发生。也就是说,必须保证 $A_1$ 和 $A_2$ 的交集是空集 ($A_1 \cap A_2 = \emptyset$)。这样,任何一个元素 $x \in A$ 要么只在 $A_1$ 中,要么只在 $A_2$ 中,其输出是唯一确定的。
💡 [数值示例]
  • 示例1 (来自练习题):
  • 尝试定义函数 $f: \mathbb{Q} \rightarrow \mathbb{Z}$,规则为 $f(a/b) = a$。
  • 我们来检查它是否良好定义
  • 选一个有理数,比如 $1/2$。它有多种表示:$1/2 = 2/4 = 3/6$。
  • 我们用不同的表示法来计算函数值:
  • 当输入表示为 $1/2$ 时,$a=1, b=2$,所以 $f(1/2) = 1$。
  • 当输入表示为 $2/4$ 时,$a=2, b=4$,所以 $f(2/4) = 2$。
  • 我们发现,$f(1/2) \neq f(2/4)$。但是 $1/2$ 和 $2/4$ 是同一个有理数!同一个输入产生了不同的输出。
  • 因此,这个函数 $f$ 不是良好定义的。
  • 示例2 (来自练习题):
  • 尝试定义函数 $g: \mathbb{Q} \rightarrow \mathbb{Q}$,规则为 $g(a/b) = a^2/b^2$。
  • 我们来检查它是否良好定义
  • 同样使用有理数 $1/2$ 和它的等价表示 $2/4$。
  • 计算函数值:
  • 当输入为 $1/2$ 时,$g(1/2) = 1^2/2^2 = 1/4$。
  • 当输入为 $2/4$ 时,$g(2/4) = 2^2/4^2 = 4/16$。
  • 我们知道 $1/4$ 和 $4/16$ 是相等的。看起来不错,我们来证明一下。
  • 假设 $a/b = c/d$ 是同一个有理数的两种表示($b, d \neq 0$)。这意味着 $ad=bc$。
  • 我们要检查 $g(a/b)$ 是否等于 $g(c/d)$,即 $a^2/b^2$ 是否等于 $c^2/d^2$。
  • $a^2/b^2 = c^2/d^2$ 等价于 $a^2 d^2 = b^2 c^2$,这又等价于 $(ad)^2 = (bc)^2$。
  • 因为我们已知 $ad=bc$,所以 $(ad)^2 = (bc)^2$ 必然成立。
  • 结论:无论我们选择哪个等价分数来表示这个有理数,函数 $g$ 的输出都是一样的。因此,函数 $g$ 是良好定义的。
⚠️ [易错点]
  1. 何时需要检查良定义性: 只要函数的定义依赖于输入的表示而不是输入对象本身,就必须检查良定义性。最常见的情况是:
  2. 在商集(quotient set)上定义函数,比如有理数 $\mathbb{Q}$(是整数对的商集),或模n的整数环 $\mathbb{Z}_n$(是整数的商集)。
  3. 函数定义在由某些生成元生成的代数结构上。
  4. 忽略检查: 在证明过程中,忘记检查良定义性是一个非常严重且常见的逻辑错误。一个非良定义的“函数”根本就不是一个函数,基于它做的任何推论都是无效的。
📝 [总结]

本段强调了在定义一个函数时,特别是当定义方式不直接作用于元素本身而是作用于其某种表示时,必须验证该函数是“良好定义”的。这意味着要确保对同一个元素的任何不同表示,函数都会给出相同、唯一的输出。

🎯 [存在目的]

“良定义性”是抽象代数中的一个守门员概念。抽象代数中充满了各种“商构造”(quotient construction),即把一些东西“等同看待”(例如,在模 5 算术中,2,7,-3 都被看作同一个东西)。当我们在这些构造出来的新对象上定义运算或函数时,良定义性是保证这些运算和函数有意义的第一步。提前引入这个概念,是为了培养读者在遇到这类情况时保持警惕的习惯。

🧠 [直觉心智模型]

想象你要给联合国的所有成员国(集合 A)评级,分为“发达”(1)和“发展中”(0)。你定义了一个函数 $f: A \rightarrow \{0, 1\}$。

现在假设你的评级规则依赖于这个国家派来的代表的着装。规则是:如果代表穿西装(集合 $A_1$),评为1;如果穿民族服装(集合 $A_2$),评为0。

问题来了:如果某国代表今天穿西装,明天穿民族服装怎么办?或者,一个国家派了两个代表,一个穿西装,一个穿民族服装?这时你的评级规则就失效了,因为对于同一个国家,你可能会给出 1 和 0 两种评级。这个函数就不是良好定义的。

一个良好定义的函数,其输出应该只跟输入对象(国家本身)有关,而与这个对象的代表(着装)无关。

💭 [直观想象]

你正在给一堆照片分类。这些照片有些是彩色的,有些是黑白的,但可能有多张照片拍的是同一个人。

你尝试定义一个分类规则(函数) $f$:

  1. $f(\text{照片}) = \text{“人物A”}$,如果照片里的人是A。
  2. $f(\text{照片}) = \text{“人物B”}$,如果照片里的人是B。

这是一个从 {所有照片} 到 {所有人} 的函数。

现在,如果你的分类规则是基于照片的某个属性,比如:

  1. $g(\text{照片}) = 1$,如果照片是彩色的。
  2. $g(\text{照片}) = 0$,如果照片是黑白的。

这本身是一个从 {照片} 到 {0,1} 的良好定义函数。

但如果你想定义一个从 {人} 到 {0,1} 的函数 $h$,而你的操作方法是“随便找一张这个人的照片,看照片是彩色还是黑白来决定 $h$ 的值”,那么这个函数 $h$ 就可能不是良好定义的。因为“人物A”可能既有彩色照片,也有黑白照片。你随机选到不同的照片(对同一个输入“人物A”的不同表示),就会得到不同的函数值(0或1)。要使 $h$ 良好定义,你必须有一个更本质的规则,比如“如果这个人生于1980年后,则 $h=1$,否则 $h=0$”,这个规则就和照片无关了。

2.5 值域与原像

📜 [原文6]

集合

$$ f(A)=\{b \in B \mid b=f(a), \text { 对于某些 } a \in A\} $$

是 $B$ 的一个子集,称为 $f$ 的值域(或 $A$ 在 $f$ 下的)。对于 $B$ 的每个子集 $C$,集合

$$ f^{-1}(C)=\{a \in A \mid f(a) \in C\} $$

由在 $f$ 下映射到 $C$ 的 $A$ 中的元素组成,称为 $C$ 在 $f$ 下的原像逆像。对于每个 $b \in B$,集合 $\{b\}$ 在 $f$ 下的原像称为 $f$ 在 $b$ 上的纤维。请注意,$f^{-1}$ 通常不是一个函数,并且 $f$ 的纤维通常包含许多元素,因为可能有许多 $A$ 中的元素映射到元素 $b$。

📖 [逐步解释]

这部分定义了与函数相关的两个重要集合:值域 (Range/Image)原像 (Preimage/Inverse Image)

  1. 值域 (Range) 或 像 (Image):
    • 符号 $f(A)$ 表示函数 $f$ 的值域。注意这里的 $A$ 是整个定义域集合。
    • 定义 $f(A)=\{b \in B \mid b=f(a), \text { 对于某些 } a \in A\}$ 的意思是:值域是上域 $B$ 的一个子集,这个子集由所有那些“被射中”的元素 $b$ 组成。“被射中”意味着,在定义域 $A$ 中,至少能找到一个元素 $a$,使得 $f(a)=b$。
    • 简而言之,值域就是所有实际输出值的集合。
    • 它也被称为“$A$ 在 $f$ 下的像”。
  2. 原像 (Preimage) 或 逆像 (Inverse Image):
    • 符号 $f^{-1}(C)$ 表示上域中的一个子集 $C$ 的原像。
    • 定义 $f^{-1}(C)=\{a \in A \mid f(a) \in C\}$ 的意思是:$C$ 的原像是定义域 $A$ 的一个子集,这个子集由所有那些“最终会射入 $C$” 的元素 $a$ 组成。
    • 换句话说,你先在上域 $B$ 里圈定一个区域 $C$,然后回到定义域 $A$ 中,把所有经过函数 $f$ 作用后、其结果会落入区域 $C$ 的那些输入元素 $a$ 全部收集起来,这个集合就是 $C$ 的原像。
  3. 纤维 (Fiber):
    • 这是一个更具体、更重要的原像概念。它是单个点的原像。
    • $f$ 在 $b$ 上的纤维,就是 $f^{-1}(\{b\})$。
    • 根据定义,它等于 $\{a \in A \mid f(a) = b\}$。
    • 也就是说,纤维是定义域中所有映射到同一个输出点 $b$ 的输入元素的集合。
  4. 关于 $f^{-1}$ 的警告:
    • 作者特别强调,$f^{-1}$ 这个符号在这里不一定代表一个函数。它是一种集合运算的记号,作用于上域的子集,返回定义域的子集
    • 为什么不是函数?因为一个输入(上域的一个元素 $b$)可能对应多个输出(定义域中的多个元素,即纤维可能包含多个元素),这违反了函数输出的唯一性。只有当函数 $f$ 是一对一的(内射)时,$f^{-1}$ 才有可能被定义为一个从值域到定义域的函数。我们后面会学到,只有当 $f$ 是双射时,才存在真正的逆函数 $f^{-1}: B \to A$。这里的记号 $f^{-1}(C)$ 是更广义的用法。
∑ [公式拆解]

公式1:值域/像

$$ f(A)=\{b \in B \mid b=f(a), \text { 对于某些 } a \in A\} $$

  • f(A): 整个定义域A在f下的像,即值域。
  • {b ∈ B | ...}: 值域是上域B的一个子集,其元素为b,b需要满足竖线后的条件。
  • b = f(a), 对于某些 a ∈ A: 条件是,这个元素 $b$ 必须是定义域 $A$ 中至少一个元素 $a$ 的函数值。 "对于某些" (for some) 等价于 "存在至少一个" ($\exists$)。

公式2:原像/逆像

$$ f^{-1}(C)=\{a \in A \mid f(a) \in C\} $$

  • $f^{-1}(C)$: 子集C的原像。
  • {a ∈ A | ...}: 原像是定义域A的一个子集,其元素为a,a需要满足竖线后的条件。
  • f(a) ∈ C: 条件是,元素 $a$ 的函数值 $f(a)$ 必须落在上域的子集 $C$ 中。
💡 [数值示例]
  • 场景:
  • 定义域 $A = \{-3, -2, -1, 0, 1, 2, 3\}$
  • 上域 $B = \{0, 1, 2, 3, 4, 5, 6, 7, 8, 9\}$
  • 函数 $f: A \rightarrow B$ 定义为 $f(x) = x^2$。
  • 计算值域/像:
  • 我们计算A中每个元素的函数值:
  • $f(-3)=9$, $f(-2)=4$, $f(-1)=1$, $f(0)=0$, $f(1)=1$, $f(2)=4$, $f(3)=9$。
  • 所有实际输出值的集合是 $\{0, 1, 4, 9\}$。
  • 所以,值域 $f(A) = \{0, 1, 4, 9\}$。
  • 注意,值域是上域 $B = \{0, 1, ..., 9\}$ 的一个真子集。
  • 计算原像:
  • 例1: 求子集 $C_1 = \{0, 1, 2, 3\}$ 的原像 $f^{-1}(C_1)$。
  • 我们要找所有 $x \in A$ 使得 $f(x) \in \{0, 1, 2, 3\}$。
  • $f(x)=x^2$。我们需要 $x^2$ 是 0, 1, 2, 或 3。
  • $x^2=0 \implies x=0$。$0 \in A$。
  • $x^2=1 \implies x=1$ 或 $x=-1$。两者都在 $A$ 中。
  • $x^2=2$ 在 $A$ 中无解。
  • $x^2=3$ 在 $A$ 中无解。
  • 把找到的 $x$ 收集起来,得到 $f^{-1}(C_1) = \{-1, 0, 1\}$。
  • 例2: 求子集 $C_2 = \{5, 6, 7\}$ 的原像 $f^{-1}(C_2)$。
  • 我们要找所有 $x \in A$ 使得 $f(x) \in \{5, 6, 7\}$。
  • $x^2=5, x^2=6, x^2=7$ 在 $A$ 中都无解。
  • 所以,没有元素映射到 $C_2$。
  • 原像是空集: $f^{-1}(C_2) = \emptyset$。
  • 计算纤维:
  • 例1: 求 4 的纤维 $f^{-1}(\{4\})$。
  • 我们要找所有 $x \in A$ 使得 $f(x) = 4$,即 $x^2 = 4$。
  • 解得 $x=2$ 或 $x=-2$。两者都在 $A$ 中。
  • 所以,4 的纤维是 $\{-2, 2\}$。
  • 例2: 求 9 的纤维 $f^{-1}(\{9\})$。
  • 我们要找所有 $x \in A$ 使得 $f(x) = 9$,即 $x^2 = 9$。
  • 解得 $x=3$ 或 $x=-3$。两者都在 $A$ 中。
  • 所以,9 的纤维是 $\{-3, 3\}$。
  • 例3: 求 1 的纤维 $f^{-1}(\{1\})$。
  • 我们要找所有 $x \in A$ 使得 $f(x) = 1$,即 $x^2 = 1$。
  • 解得 $x=1$ 或 $x=-1$。两者都在 $A$ 中。
  • 所以,1 的纤维是 $\{-1, 1\}$。
  • 从这几个例子可以看出,纤维可以包含多个元素,所以 $f^{-1}$ 不是一个从 $B$ 的元素到 $A$ 的元素的函数。
⚠️ [易错点]
  1. $f(A)$ vs $f(a)$: $f(a)$ 是一个元素,是 $f$ 作用在元素 $a$ 上的结果。$f(A)$ 是一个集合,是 $f$ 作用在集合 $A$ 所有元素上得到的结果的集合。
  2. $f^{-1}$ 的双重含义: 一定要根据上下文判断 $f^{-1}$ 是指逆像(作用于集合,总是存在)还是逆函数(作用于元素,仅当原函数是双射时存在)。在学习群论的同态基本定理时,这个区别尤为重要。
  3. 空集的原像和像:
  4. $f(\emptyset) = \emptyset$ (空集里没东西,自然没什么输出)
  5. $f^{-1}(\emptyset) = \emptyset$ (要映射到空集里是不可能的,所以没有输入能做到)
📝 [总结]

本段定义了函数的两个核心关联集合:值域(像),即所有实际输出的集合;原像(逆像),即所有能映射到某个目标子集的输入的集合。同时特别定义了“纤维”作为单点元素的原像,并警告读者不要将广义的逆像符号 $f^{-1}$ 与逆函数混淆。

🎯 [存在目的]

值域和原像是分析函数性质的基础工具。

  1. 函数的满射性直接由值域是否等于上域来定义。
  2. 函数的内射性与纤维的大小直接相关(内射等价于所有纤维最多只包含一个元素)。
  3. 在群论中,一个群同态的核 (Kernel) 正是单位元的纤维,这是群论中最重要的概念之一。

因此,提前精确定义这些概念是为后续更深入的理论铺路。

🧠 [直觉心智模型]

继续使用自动售货机 f 的例子:

  1. 定义域 A: {一角, 五角, 一元}
  2. 上域 B: {可乐, 薯片, 巧克力, 矿泉水}
  3. 法则 f: $f(\text{一角})=\text{矿泉水}, f(\text{五角})=\text{薯片}, f(\text{一元})=\text{可乐}$
  4. 值域 (像) $f(A)$: 实际卖出的商品种类。在这个例子中是 {矿泉水, 薯片, 可乐}。巧克力虽然在上域里,但不在值域里,因为没有硬币能买到它。
  5. 原像 $f^{-1}(C)$: 假设你想知道“哪些硬币可以买到零食?”。零食集合是 $C = \{\text{薯片}, \text{巧克力}\}$。我们回头看,只有“五角”能买到薯片,没有硬币能买到巧克力。所以 $f^{-1}(C) = \{\text{五角}\}$。
  6. 纤维 $f^{-1}(\{b\})$: “什么硬币能买到可乐?”。答案是“一元”。所以可乐的纤维是 $f^{-1}(\{\text{可乐}\}) = \{\text{一元}\}$。
💭 [直观想象]

继续使用弓箭手的例子:

  1. 定义域 A: {箭1, 箭2, 箭3, 箭4, 箭5}
  2. 上域 B: 整个圆形靶子
  3. 函数 f: 射箭行为。$f(\text{箭1})=点P_1, f(\text{箭2})=点P_2, ...$
  4. 值域 (像) $f(A)$: 靶子上所有中箭的点的集合 $\{P_1, P_2, P_3, P_4, P_5\}$。
  5. 原像 $f^{-1}(C)$: 假设你在靶子上画了一个红心区域 $C$。$f^{-1}(C)$ 就是所有射中了红心区域的那些箭的集合。如果箭1和箭3射中了红心,那么 $f^{-1}(C) = \{\text{箭1, 箭3}\}$。
  6. 纤维 $f^{-1}(\{b\})$: 假设靶心正中央是点 $b$。弓箭手技术高超,箭2和箭5都射中了同一个点 $b$。那么点 $b$ 的纤维就是 $f^{-1}(\{b\}) = \{\text{箭2, 箭5}\}$。

2.6 函数的复合

📜 [原文7]

如果 $f: A \rightarrow B$ 且 $g: B \rightarrow C$,则复合映射 $g \circ f: A \rightarrow C$ 定义为

$$ (g \circ f)(a)=g(f(a)) $$

📖 [逐步解释]

这部分介绍了函数复合 (Composition of functions),一种将多个函数串联起来形成一个新函数的方法。

  1. 前提条件: 要能进行复合 $g \circ f$,必须满足一个关键条件:前一个函数 $f$ 的上域 $B$ 必须是后一个函数 $g$ 的定义域。实际上,更精确的要求是 $f$ 的值域必须是 $g$ 的定义域的子集。但通常为了方便,我们会直接要求 $f$ 的上域就是 $g$ 的定义域。
  2. 新函数: 复合的结果是一个全新的函数,记作 $g \circ f$。
    • 它的定义域是第一个函数 $f$ 的定义域 $A$。
    • 它的上域是第二个函数 $g$ 的上域 $C$。
    • 所以 $g \circ f: A \rightarrow C$。
  3. 运算规则: 复合函数如何作用于一个元素 $a \in A$ 呢?
    • 符号 $g \circ f$ 的运算顺序是从右向左的。
    • 首先,将 $a$ 代入右边的函数 $f$,得到一个中间结果 $f(a)$。这个结果在集合 $B$ 中。
    • 然后,将这个中间结果 $f(a)$ 作为输入,代入左边的函数 $g$,得到最终结果 $g(f(a))$。这个结果在集合 $C$ 中。
∑ [公式拆解]

公式:

$$ (g \circ f)(a)=g(f(a)) $$

  • g ∘ f: 新的复合函数的名称。∘ 是复合运算符。
  • (g ∘ f)(a): 复合函数作用于元素 $a$。
  • =: 定义等于。
  • g(f(a)): 具体的计算过程。
  • f(a): 内层函数先计算,得到一个在 $B$ 中的值。
  • g(...): 外层函数再计算,把内层函数的结果作为自己的输入。
💡 [数值示例]
  • 示例1:
  • 设 $f: \mathbb{Z} \rightarrow \mathbb{Z}$ 定义为 $f(x) = x+1$ (加一函数)。
  • 设 $g: \mathbb{Z} \rightarrow \mathbb{Z}$ 定义为 $g(y) = y^2$ (平方函数)。
  • $f$ 的上域 $\mathbb{Z}$ 和 $g$ 的定义域 $\mathbb{Z}$ 相同,可以复合。
  • 计算复合函数 $g \circ f$:
  • $(g \circ f)(x) = g(f(x)) = g(x+1) = (x+1)^2 = x^2+2x+1$。
  • 这是一个从 $\mathbb{Z}$ 到 $\mathbb{Z}$ 的新函数。
  • 例如,$(g \circ f)(3) = (3+1)^2 = 16$。
  • 我们也可以分步验证:$f(3)=3+1=4$,然后 $g(4)=4^2=16$。结果一致。
  • 计算复合函数 $f \circ g$:
  • $(f \circ g)(y) = f(g(y)) = f(y^2) = y^2+1$。
  • 这是一个从 $\mathbb{Z}$ 到 $\mathbb{Z}$ 的新函数。
  • 例如,$(f \circ g)(3) = 3^2+1 = 10$。
  • 分步验证:$g(3)=3^2=9$,然后 $f(9)=9+1=10$。结果一致。
  • 重要观察: $g \circ f \neq f \circ g$。函数复合的顺序很重要,它一般是不可交换的。
  • 示例2:
  • 设 $A=\{\text{苹果, 梨}\}$,$B=\{\text{红色, 绿色}\}$,$C=\{\text{甜, 酸}\}$。
  • $f: A \rightarrow B$ 定义为 $f(\text{苹果})=\text{红色}, f(\text{梨})=\text{绿色}$ (水果的颜色)。
  • $g: B \rightarrow C$ 定义为 $g(\text{红色})=\text{甜}, g(\text{绿色})=\text{酸}$ (颜色的味道联想)。
  • 复合函数 $g \circ f: A \rightarrow C$ 的作用是判断水果的味道联想。
  • $(g \circ f)(\text{苹果}) = g(f(\text{苹果})) = g(\text{红色}) = \text{甜}$。
  • $(g \circ f)(\text{梨}) = g(f(\text{梨})) = g(\text{绿色}) = \text{酸}$。
⚠️ [易错点]
  1. 顺序错误: 最常见的错误是把 $g \circ f$ 的计算顺序搞反,误算为 $f(g(a))$。务必记住是从右向左。
  2. 复合条件不满足: 如果 $f: A \to B$,$g: C \to D$,而 $B \neq C$,则 $g \circ f$ 一般是无定义的。例如,$f: \mathbb{Z} \to \mathbb{Z}$,$g: \mathbb{R}^+ \to \mathbb{R}$,$g(x)=\ln x$。$g \circ f$ 可能无定义,因为 $f$ 的输出可能是负数或0,而 $g$ 的定义域是正实数。比如 $f(-2)=-1$,但 $g(-1)=\ln(-1)$ 无定义。
📝 [总结]

本段定义了函数的复合运算 $g \circ f$,其法则是将一个函数的输出作为另一个函数的输入,并且强调了运算顺序是从右向左。

🎯 [存在目的]

函数复合是构造新函数的基本方法。在抽象代数中,复合有极其重要的性质。例如:

  1. 结合律: 函数复合满足结合律,即 $(h \circ g) \circ f = h \circ (g \circ f)$。这个性质是的公理之一。后面会看到,一个集合上的所有置换(双射函数)在复合运算下构成一个群(对称群),这是群论的起源之一。
  2. 保持性质: 两个同态的复合仍然是同态。两个同构的复合仍然是同构。这使得我们可以把代数结构之间的关系传递下去。
🧠 [直觉心智模型]

想象一个生产流水线

  1. 工人 f: 负责把原材料 a 加工成半成品 f(a)
  2. 工人 g: 负责把半成品 b 加工成最终产品 g(b)
  3. 复合 $g \circ f$: 就是整个流水线的工作流程。把原材料 a 放上传送带,它先经过工人 f,变成 f(a),然后继续在传送带上传递,经过工人 g,最终变成 g(f(a))
  4. 注意,必须是 f 的产出能作为 g 的输入才行,否则流水线就断了。
💭 [直观想象]

你正在使用手机修图。

  1. 你有一张原图 a
  2. 你先使用了一个“锐化”滤镜 f,得到了图片 $f(a)$。
  3. 然后你又对这张锐化过的图使用了一个“复古”滤镜 g,得到了最终的图片 $g(f(a))$。
  4. 整个操作过程就相当于应用了一个复合滤镜 $(g \circ f)$。
  5. 如果你先用“复古”滤镜 g,再用“锐化”滤镜 f,得到的结果 $f(g(a))$ 很可能和原来不一样。这再次说明了复合的顺序是重要的。

2.7 函数的性质:内射、满射、双射

📜 [原文8]

设 $f: A \rightarrow B$。

(1) 如果每当 $a_{1} \neq a_{2}$ 时,$f\left(a_{1}\right) \neq f\left(a_{2}\right)$,则 $f$ 是内射单射

(2) 如果对于所有 $b \in B$,存在某个 $a \in A$ 使得 $f(a)=b$,则 $f$ 是满射外射,即 $f$ 的是 $B$ 的全部。请注意,由于函数总是映射到其值域(根据定义),因此为了使满射性问题有意义,需要指定上域 $B$。

(3) 如果 $f$ 既是内射又是满射,则 $f$ 是双射一对一对应。如果存在从 $A$ 到 $B$ 的这种双射 $f$,我们称 $A$ 和 $B$ 双射对应

(4) 如果存在一个函数 $g: B \rightarrow A$ 使得 $g \circ f: A \rightarrow A$ 是 $A$ 上的恒等映射,即对于所有 $a \in A$,$(g \circ f)(a)=a$,则 $f$ 具有左逆

(5) 如果存在一个函数 $h: B \rightarrow A$ 使得 $f \circ h: B \rightarrow B$ 是 $B$ 上的恒等映射,则 $f$ 具有右逆

📖 [逐步解释]

这部分定义了函数的三种核心性质,并引入了左逆和右逆的概念,它们与这些性质密切相关。

  1. 内射 (Injective) / 单射 (One-to-one):
    • 定义: “不同的输入导致不同的输出”。
    • $a_1 \neq a_2 \implies f(a_1) \neq f(a_2)$。
    • 在证明中,我们通常使用它的逆否命题 (contrapositive),这个形式更好用:如果 $f(a_1) = f(a_2)$,那么必然有 $a_1 = a_2$。也就是说,“相同的输出必然来自相同的输入”。
    • 直观理解: 没有“多对一”的映射,只有“一对一”的。不同的输入不会“挤”到同一个输出点上。
    • 回顾“纤维”的概念,一个函数是内射的,当且仅当它的每个纤维要么是空集,要么只包含一个元素。
  2. 满射 (Surjective) / 外射 (Onto):
    • 定义: 上域中的每一个元素都至少被一个输入映射到了。
    • 对于任意一个 $b \in B$,你总能在定义域 $A$ 中找到至少一个 $a$,使得 $f(a)=b$。
    • 等价说法: 函数的值域等于其上域,即 $f(A) = B$。
    • 作者的注释: 满射性是一个依赖于你如何规定上域 $B$ 的性质。任何函数 $f: A \to B$,如果你把它的上域 B 修改为它的值域 $f(A)$,那么这个新函数 $f': A \to f(A)$ 自动就是满射的。因此,讨论满射性时,上域必须事先明确指定。
  3. 双射 (Bijective) / 一对一对应 (One-to-one correspondence):
    • 定义: 一个函数同时满足内射满射
    • 直观理解: 它是完美的“配对”。定义域 $A$ 中的每个元素都与上域 $B$ 中的一个元素唯一地配对,反之亦然。$B$ 中的每个元素也都有且仅有一个来自 $A$ 的“伙伴”。
    • 双射对应: 如果存在一个从 $A$ 到 $B$ 的双射函数,我们就说集合 $A$ 和 $B$ 是“双射对应”的。这意味着从集合论的角度看,这两个集合的大小是完全一样的。对于有限集合,就是它们的元素个数相等。对于无限集合,这是判断两个无限集合“大小”是否相同的标准。
  4. 左逆 (Left Inverse):
    • $f: A \to B$ 有一个左逆 $g: B \to A$,如果复合 $g \circ f$ 的结果是“什么都没发生”。
    • $g \circ f: A \to A$ 是恒等映射 (Identity map),记作 $id_A$。
    • $(g \circ f)(a) = g(f(a)) = a$ 对所有 $a \in A$ 成立。
    • 直观理解: 你从 $A$ 出发,经过 $f$ 到达 $B$,再经过 $g$ 回到 $A$,最终回到了你出发的那个点。$g$ “撤销”了 $f$ 的操作。
  5. 右逆 (Right Inverse):
    • $f: A \to B$ 有一个右逆 $h: B \to A$,如果复合 $f \circ h$ 的结果是“什么都没发生”。
    • $f \circ h: B \to B$ 是恒等映射,记作 $id_B$。
    • $(f \circ h)(b) = f(h(b)) = b$ 对所有 $b \in B$ 成立。
    • 直观理解: 你从 $B$ 的任意一点 $b$ 出发,先通过 $h$ “逆向”回到 $A$,再通过 $f$ “正向”走一遍,最终回到了你出发的 $B$ 点。
💡 [数值示例]

设 $A = \{1, 2, 3\}$, $B = \{x, y, z, w\}$

  • 示例1: 内射但非满射
  • $f_1: A \to B$ 定义为 $f_1(1)=x, f_1(2)=y, f_1(3)=z$。
  • 内射? 是。不同的输入 1, 2, 3 对应不同的输出 x, y, z。
  • 满射? 不是。因为上域 $B$ 中的元素 $w$ 没有被任何输入映射到。值域 $\{x,y,z\} \neq B$。
  • 示例2: 满射但非内射
  • 为了构造满射,我们需要缩小上域。设 $B' = \{x, y\}$。
  • $f_2: A \to B'$ 定义为 $f_2(1)=x, f_2(2)=y, f_2(3)=x$。
  • 内射? 不是。因为 $f_2(1) = f_2(3) = x$,但 $1 \neq 3$。两个不同的输入映射到了同一个输出。
  • 满射? 是。上域 $B'$ 中的 $x$ 和 $y$ 都被映射到了。
  • 示例3: 双射
  • 为了构造双射,定义域和上域大小必须相同。设 $A = \{1, 2, 3\}$, $B'' = \{x, y, z\}$。
  • $f_3: A \to B''$ 定义为 $f_3(1)=y, f_3(2)=z, f_3(3)=x$。
  • 内射? 是。
  • 满射? 是。
  • 因此,$f_3$ 是一个双射。集合 $A$ 和 $B''$ 是双射对应的。
  • 示例4: 左逆和右逆
  • 考虑内射函数 $f_1: \{1, 2, 3\} \to \{x, y, z, w\}$。
  • 它可以有一个左逆 $g: \{x, y, z, w\} \to \{1, 2, 3\}$。我们可以定义 $g(x)=1, g(y)=2, g(z)=3$。对于 $w$,我们可以任意指定,比如 $g(w)=1$。
  • 验证: $(g \circ f_1)(1)=g(f_1(1))=g(x)=1$。 $(g \circ f_1)(2)=g(f_1(2))=g(y)=2$。 $(g \circ f_1)(3)=g(f_1(3))=g(z)=3$。所以 $g \circ f_1 = id_A$。
  • $f_1$ 有左逆。但它有右逆吗?$(f_1 \circ g)(w) = f_1(g(w)) = f_1(1) = x \neq w$。所以它没有右逆。
  • 考虑满射函数 $f_2: \{1, 2, 3\} \to \{x, y\}$。
  • 它可以有一个右逆 $h: \{x, y\} \to \{1, 2, 3\}$。对于 $x$,我们需要找一个 $f_2$ 的输入能得到它,比如 1 或 3。我们选一个,定义 $h(x)=1$。对于 $y$,输入是 2,所以定义 $h(y)=2$。
  • 验证: $(f_2 \circ h)(x) = f_2(h(x)) = f_2(1)=x$。$(f_2 \circ h)(y) = f_2(h(y)) = f_2(2)=y$。所以 $f_2 \circ h = id_B$。
  • $f_2$ 有右逆。但它有左逆吗?$(h \circ f_2)(3) = h(f_2(3)) = h(x)=1 \neq 3$。所以它没有左逆。
⚠️ [易错点]
  1. 证明内射/满射的模板:
  2. 证明内射: “设 $f(a_1) = f(a_2)$。 ... (进行代数运算) ... 因此 $a_1=a_2$。所以 $f$ 是内射的。”
  3. 证明满射: “任取一个元素 $b \in B$。我们需要找到一个 $a \in A$ 使得 $f(a)=b$。令 $a = ...$ (用 $b$ 来构造 $a$)。 ... (验证这个 $a$ 确实在 $A$ 中并且 $f(a)=b$)。所以 $f$ 是满射的。”
  4. 空集上的函数: 从空集 $\emptyset$ 到任何非空集合 $B$ 的函数是存在的(只有一种,即空函数),并且它是内射的(因为 "a1 != a2" 这个前提永远是假的),但不是满射的。从非空集合 $A$ 到空集 $\emptyset$ 的函数是不存在的。
  5. 左逆和右逆不唯一: 如示例4所示,当函数不是双射时,它的左逆或右逆通常不是唯一的。对于 $f_1$ 的左逆 $g$,$g(w)$ 的取值可以是 1, 2, 或 3 中的任意一个。对于 $f_2$ 的右逆 $h$,$h(x)$ 的取值可以是 1 或 3。
📝 [总结]

本段定义了函数的三大性质:

  1. 内射 (一对一): 不同输入必有不同输出。
  2. 满射 (映上): 上域中无遗漏,所有元素都被命中。
  3. 双射: 既是内射又是满射,形成完美配对。

并引入了与这些性质相关的左逆右逆的概念。

🎯 [存在目的]

这三种性质是分类和理解函数的基本框架。在抽象代数中:

  1. 内射函数(特别是内射同态)允许我们将一个小的代数结构“嵌入”到一个大的代数结构中。
  2. 满射函数(特别是满射同态)允许我们从一个大的代数结构构造出一个“更简单”的商结构(这与同态基本定理密切相关)。
  3. 双射函数(特别是双射同态,即同构)是抽象代数的最高追求。如果两个代数结构之间存在同构,我们就认为它们在代数上是“相同”的,只是元素的叫法不同。这是判断两个结构是否等价的黄金标准。

左逆和右逆的概念则为下一节的命题1提供了铺垫,将这三种性质与逆的存在性直接联系起来。

[直觉心-智模型]

想象一场相亲大会,男士集合 $A$,女士集合 $B$。函数 $f$ 是配对规则,$f(a)=b$ 表示男士 $a$ 选择与女士 $b$ 配对。

  1. 内射: 没有“花心男”。每个男士都只选一位女士,不会出现两个男士选了同一个女士的情况。但可能有些女士无人问津。
  2. 满射: 没有“落单女”。每位女士都至少有一位男士选择。但可能某位受欢迎的女士被多位男士同时选择(此时就不是内射了)。
  3. 双射: 完美匹配。每位男士都选择了一位女士,且每位女士都恰好被一位男士选择。皆大欢喜,一一对应。
  4. 左逆: 从女士的角度看,可以明确指出“选我的是谁”。如果 $f$ 是内射的,那么选 $b$ 女士的男士最多只有一个,这个“反向”关系是明确的(对于没人选的女士,可以随便指定一个男士,反正用不上)。
  5. 右逆: 从女士的角度看,可以为自己“拉”一个配对男士。如果 $f$ 是满射的,那么对于任何女士 $b$,总能找到至少一个选她的男士 $a$,她可以指定这个 $a$ 作为她的配对对象。
💭 [直观想象]

想象你有一堆钥匙(集合A)和一堆(集合B)。函数 $f(k)=l$ 表示钥匙 $k$ 能打开锁 $l$。

  1. 内射: 没有两把钥匙能开同一把锁。一把钥匙只对应一把锁。但可能有些锁一把钥匙也打不开。
  2. 满射: 所有的锁都能被打开。每把锁都至少有一把钥匙能打开它。但可能有些万能钥匙能开好几把锁。
  3. 双射: 完美的一一对应。每把钥匙刚好打开一把锁,每把锁也刚好被一把钥匙打开。就像酒店房间的钥匙和门锁。
  4. 左逆: 如果给你一把钥匙 $k$,你用它开了锁 $l=f(k)$,现在有一个反向操作 $g$,输入锁 $l$ 就能还给你原来的钥匙 $k$。这就是左逆。
  5. 右逆: 如果你随便拿一把锁 $l$,有一个操作 $h$ 能给你一把钥匙 $k=h(l)$,然后你用这把钥匙 $k$ 去开锁 $l$,发现刚好能打开。这就是右逆。

2.8 命题1:函数性质与逆的关系

📜 [原文9]

命题 1。设 $f: A \rightarrow B$。

(1) 映射 $f$ 是内射当且仅当 $f$ 具有左逆

(2) 映射 $f$ 是满射当且仅当 $f$ 具有右逆

(3) 映射 $f$ 是双射当且仅当存在 $g: B \rightarrow A$ 使得 $f \circ g$ 是 $B$ 上的恒等映射且 $g \circ f$ 是 $A$ 上的恒等映射

(4) 如果 $A$ 和 $B$ 是具有相同元素数量的有限集合(即 $|A|=|B|$),则 $f: A \rightarrow B$ 是双射当且仅当 $f$ 是内射当且仅当 $f$ 是满射

证明:练习。

在上述命题的第 (3) 部分中,映射 $g$ 必然是唯一的,我们称 $g$ 是 $f$ 的双侧逆(或简称)。

📖 [逐步解释]

这个命题非常重要,它把上一节定义的抽象性质(内射、满射、双射)与更具体、更具构造性的概念(左逆、右逆、双侧逆)完全等价了起来。

  1. 内射 $\iff$ 左逆:
    • ($\Rightarrow$) 如果 $f$ 是内射的,那么它有左逆。
    • 我们需要构造一个函数 $g: B \to A$。对于 $B$ 中的元素 $b$,有两种情况:
  2. $b$ 在 $f$ 的值域中。因为 $f$ 是内射的,所以最多只有一个 $a \in A$ 使得 $f(a)=b$。我们就定义 $g(b)$ 等于这个唯一的 $a$。
  3. $b$ 不在 $f$ 的值域中。这时 $b$ 没有任何对应的 $a$。为了让 $g$ 成为一个完整的函数,我们必须为这些 $b$ 也指定一个输出。我们可以从 $A$ 中随便选一个固定的元素 $a_0$,让所有这些“无关”的 $b$ 都映射到 $a_0$。
    • 这样构造出的 $g$ 就是一个左逆。因为对于任何 $a \in A$,$g(f(a))$ 会根据第一条规则,准确地返回 $a$ 本身。
    • ($\Leftarrow$) 如果 $f$ 有左逆 $g$,那么 $f$ 是内射的。
    • 我们要证明内射性,使用其逆否命题形式:假设 $f(a_1)=f(a_2)$,我们要证明 $a_1=a_2$。
    • 因为 $f(a_1)=f(a_2)$,我们可以把它们同时作为 $g$ 的输入,得到 $g(f(a_1))=g(f(a_2))$。
    • 根据左逆的定义, $g(f(a_1)) = a_1$ 且 $g(f(a_2)) = a_2$。
    • 因此,我们得到 $a_1 = a_2$。证明完毕。
  4. 满射 $\iff$ 右逆:
    • ($\Rightarrow$) 如果 $f$ 是满射的,那么它有右逆。
    • 我们需要构造一个函数 $h: B \to A$。对于 $B$ 中的任意一个元素 $b$,因为 $f$ 是满射的,所以至少存在一个 $a \in A$ 使得 $f(a)=b$。
    • $b$ 的纤维 $f^{-1}(\{b\})$ 是非空的。我们从这个纤维(一个集合)中选择一个元素 $a$,并定义 $h(b)=a$。
    • 这里隐含了选择公理 (Axiom of Choice),即我们承认可以从多个非空集合中同时各选出一个元素来形成一个新的集合。对于无限集,这是必需的。
    • 这样构造出的 $h$ 就是一个右逆。因为对于任何 $b \in B$,$f(h(b)) = f(a) = b$。
    • ($\Leftarrow$) 如果 $f$ 有右逆 $h$,那么 $f$ 是满射的。
    • 我们要证明满射性:对于任意 $b \in B$,我们需要找到一个 $a \in A$ 使得 $f(a)=b$。
    • 右逆 $h: B \to A$ 的存在告诉我们,对于这个 $b$,存在一个元素 $h(b) \in A$。
    • 我们就选择 $a = h(b)$。
    • 根据右逆的定义,$f(a) = f(h(b)) = b$。
    • 我们成功地找到了所需的 $a$。证明完毕。
  5. 双射 $\iff$ 双侧逆:
    • 一个函数是双射的,意味着它既是内射的又是满射的。
    • 根据 (1) 和 (2),这等价于它既有左逆 $g$ 又有右逆 $h$。
    • 可以证明,在这种情况下,左逆和右逆必然是同一个函数,即 $g=h$。证明:$g = g \circ id_B = g \circ (f \circ h) = (g \circ f) \circ h = id_A \circ h = h$。
    • 这个唯一的、既是左逆又是右逆的函数 $g$,就被称为 $f$ 的逆函数,记为 $f^{-1}$ (这里的 $f^{-1}$ 是一个真正的函数,不要和之前讲的逆像混淆)。
    • 反过来,如果存在一个双侧逆 $g$,那么它既是左逆又是右逆,根据 (1) 和 (2),$f$ 必然既是内射的又是满射的,因此是双射的。
  6. 有限集合的特殊情况:
    • 这个性质也被称为鸽巢原理 (Pigeonhole Principle) 的一个推论。
    • 你有 $n$ 个鸽子 ($|A|=n$) 和 $n$ 个鸽巢 ($|B|=n$)。函数 $f: A \to B$ 就是一个放鸽子的方案。
    • 内射 $\implies$ 双射: 如果 $f$ 是内射的,意味着每个鸽子都飞进了不同的鸽巢。因为鸽子和鸽巢数量一样多,所以必然每个鸽巢都恰好有一只鸽子。因此 $f$ 也是满射的,所以是双射。
    • 满射 $\implies$ 双射: 如果 $f$ 是满射的,意味着每个鸽巢里都至少有一只鸽子。因为鸽子和鸽巢数量一样多,所以必然每个鸽巢都恰好只有一只鸽子(否则总鸽子数会超过 $n$)。因此没有两个鸽子在同一个巢里,所以 $f$ 也是内射的,所以是双射。
    • 重要警告: 这个性质仅对有限集合定义域和上域大小相等时成立。对于无限集合,这是完全错误的。例如,$f: \mathbb{Z} \to \mathbb{Z}$ 定义为 $f(x)=2x$,它是内射的,但不是满射的(奇数没有被映射到)。
  • 逆的唯一性:
  • 如果一个函数 $f$ 是双射的,那么它的逆函数是唯一的。这个唯一的逆 $g$ 本身也是一个双射函数,且 $g$ 的逆就是 $f$。
💡 [数值示例]
  • 回顾示例:
  • $f_1: \{1,2,3\} \to \{x,y,z,w\}$ (内射非满射) $\implies$ 有左逆,无右逆。
  • $f_2: \{1,2,3\} \to \{x,y\}$ (满射非内射) $\implies$ 有右逆,无左逆。
  • $f_3: \{1,2,3\} \to \{x,y,z\}$ (双射) $\implies$ 有唯一的双侧逆。
  • $f_3(1)=y, f_3(2)=z, f_3(3)=x$。
  • 它的逆函数 $g: \{x,y,z\} \to \{1,2,3\}$ 必然是 $g(x)=3, g(y)=1, g(z)=2$。
  • 你可以验证 $g \circ f_3 = id_{\{1,2,3\}}$ 且 $f_3 \circ g = id_{\{x,y,z\}}$。
  • 有限集合特例:
  • 设 $A=B=\{1, 2, 3\}$,所以 $|A|=|B|=3$。
  • 定义 $f: A \to B$ 为 $f(1)=2, f(2)=3, f(3)=1$。
  • 我们只检查内射性:输出是 $\{1, 2, 3\}$,没有重复。所以是内射的。
  • 根据命题1(4),我们无需再检查满射性,可以直接断定 $f$ 是双射的。
  • (事后验证:值域是 $\{1,2,3\}$,等于上域,确实是满射的。)
⚠️ [易错点]
  1. 无限集 vs 有限集: 切记不要将命题1(4)的结论滥用到无限集合上。这是初学者在面对无限集问题时最常犯的直觉错误之一。
  2. 选择公理: 在为满射函数构造右逆时,对无限集而言,选择公理是理论上不可或缺的。在大多数代数学习中,我们默认接受选择公理。
📝 [总结]

命题1建立了函数性质和逆的存在性之间的桥梁:

  1. 内射 $\iff$ 存在左逆。
  2. 满射 $\iff$ 存在右逆。
  3. 双射 $\iff$ 存在唯一的双侧逆(逆函数)。

它还特别指出了在定义域和上域是大小相等的有限集合这一特殊情况下,内射、满射、双射三者是等价的。

🎯 [存在目的]

这个命题将函数的抽象性质转化为了一个更具体的问题:“是否存在一个起‘撤销’作用的函数?”。这种转化非常有用。在代数结构的范畴里,如果一个同态是双射的(即同构),那么它的逆函数也必然是一个同态,这意味着两个结构之间存在一种完全可逆的、保持结构的对应关系。这个命题是理解同构概念的基石。

🧠 [直觉心智模型]

回到相亲大会模型 ($f: A \to B$)。

  1. 内射 $\iff$ 左逆: $f$ 是内射的(没有花心男)。这意味着对于任何一位被选中的女士 $b$,她可以明确地指出“选我的是谁”,这个“谁”是唯一的。这个反向指出操作就是左逆 $g$ 的一部分。对于没被选中的女士,她们的 $g$ 值可以随便指派,不影响“撤销”功能。
  2. 满射 $\iff$ 右逆: $f$ 是满射的(没有落单女)。这意味着对于任何一位女士 $b$,她都可以从选她的男士中(至少有一位)挑选一个作为自己的官方配对。这个“挑选”操作就是右逆 $h$。
  3. 双射 $\iff$ 双侧逆: $f$ 是双射的(完美匹配)。那么每位女士 $b$ 既可以明确指出唯一的配对男士 $a$(左逆),也可以为自己挑选唯一的配-对男士 $a$(右逆)。这两个操作指向同一个人,因此左右逆是同一个完美的“反向配对”函数。
💭 [直观想象]

回到钥匙与锁模型 ($f: k \to l$)。

  1. 内射 $\iff$ 左逆: 每把锁最多被一把钥匙打开。那么,给你一把被打开的锁 $l$,你就能找到唯一的那把钥匙 $k$。这就是左逆。对于那些打不开的锁,这个逆操作可以返回一把废钥匙。
  2. 满射 $\iff$ 右逆: 每把锁都能被打开。那么,随便给你一把锁 $l$,你总能(从可能的多把钥匙中)找到一把能打开它的钥匙 $k$。这个寻找过程就是右逆。
  3. 双射 $\iff$ 双侧逆: 一一对应。那么给你一把锁,你就能找到唯一能打开它的钥匙;给你一把钥匙,你也能找到它唯一能打开的锁。这两个方向的操作互为逆过程。

2.9 置换、限制与扩张

📜 [原文10]

集合 $A$ 的置换(permutation)就是从 $A$ 到自身的一个双射

如果 $A \subseteq B$ 且 $f: B \rightarrow C$,我们用 $\left.f\right|_{A}$ 表示 $f$ 对 $A$ 的限制。当我们所考虑的定义域是明确的,即使这些是形式上不同的函数(它们的定义域不同),我们偶尔也会将 $\left.f\right|_{A}$ 再次简单地表示为 $f$。

如果 $A \subseteq B$ 且 $g: A \rightarrow C$,并且存在一个函数 $f: B \rightarrow C$ 使得 $\left.f\right|_{A}=g$,我们将称 $f$ 是 $g$ 到 $B$ 的扩张(这样的映射 $f$ 不一定存在,也不一定唯一)。

📖 [逐步解释]

这部分引入了三个与函数相关的重要术语。

  1. 置换 (Permutation):
    • 定义: 一个集合 $A$ 到它自身的双射函数 ($f: A \to A$, $f$ is bijective)。
    • 直观理解: 置换就是对集合 $A$ 中的元素进行“重新排列”或“洗牌”。每个元素都被移动到一个新的位置,没有两个元素被移到同一个位置,且所有原来的位置也都被新的元素占据。
    • 置换是群论的起源和核心研究对象之一。一个固定集合上的所有置换,在函数复合运算下,构成一个非常重要的群,称为对称群 (Symmetric Group)
  2. 限制 (Restriction):
    • 场景: 你有一个“大”函数 $f$,它的定义域是 $B$ ($f: B \to C$)。同时你有一个小集合 $A$,它是 $B$ 的一个子集 ($A \subseteq B$)。
    • 定义: $f$ 对 $A$ 的限制,记作 $\left.f\right|_{A}$,是一个新的函数。
    • 这个新函数的定义域是小集合 $A$。
    • 它的上域仍然是 $C$。
    • 它的函数法则和原来的 $f$ 完全一样,只是它只接受来自 $A$ 的输入。
    • 即 $\left.f\right|_{A}: A \to C$,且对于所有 $a \in A$,有 $\left.f\right|_{A}(a) = f(a)$。
    • 简化记法: 有时为了方便,如果上下文中很清楚我们正在讨论子集 $A$ 上的行为,作者可能会直接用 $f$ 来表示 $\left.f\right|_{A}$。虽然它们在形式上是两个不同的函数(因为定义域不同),但这样做可以简化书写。
  3. 扩张 (Extension):
    • 场景: 这是限制的逆过程。你有一个“小”函数 $g$,它的定义域是 $A$ ($g: A \to C$)。同时有一个大集合 $B$ 包含 $A$ ($A \subseteq B$)。
    • 定义: $g$ 到 $B$ 的扩张 $f$ 是一个定义在 $B$ 上的新函数 ($f: B \to C$),它在大集合 $B$ 上的行为要“兼容”小函数 $g$ 在 $A$ 上的行为。
    • 兼容条件: 扩张 $f$ 在子集 $A$ 上的限制必须等于原来的小函数 $g$,即 $\left.f\right|_{A} = g$。
    • 这意味着,对于所有在小集合 $A$ 里的元素 $a$,必须有 $f(a) = g(a)$。
    • 对于那些在 $B$ 中但不在 $A$ 中的元素 ($x \in B \setminus A$),$f(x)$ 的值可以任意定义(只要在 $C$ 中)。
    • 存在性和唯一性:
    • 扩张总是存在的(因为我们可以为 $B \setminus A$ 中的元素任意指定一个在 $C$ 中的值)。
    • 扩张通常不是唯一的,除非 $A=B$。因为对于 $B \setminus A$ 中的元素,你有多种选择来定义 $f$ 的值。
    • 在特定问题中(如线性代数、拓扑学),我们常常关心是否存在保持某些良好性质(如线性、连续性)的扩张,这时扩张可能不再是平凡的,甚至可能唯一或不存在。
💡 [数值示例]
  • 示例1: 置换
  • 设 $A = \{1, 2, 3\}$。
  • 函数 $\sigma: A \to A$ 定义为 $\sigma(1)=2, \sigma(2)=3, \sigma(3)=1$ 是一个置换。它是一个双射。
  • 函数 $\tau: A \to A$ 定义为 $\tau(1)=2, \tau(2)=1, \tau(3)=3$ 也是一个置换。
  • 函数 $f: A \to A$ 定义为 $f(1)=1, f(2)=2, f(3)=2$ 不是置换,因为它不是内射(2和3都映到2),也不是满射(1没有被映到)。
  • 示例2: 限制
  • 设“大”函数 $f: \mathbb{Z} \to \mathbb{Z}$ 定义为 $f(x) = x^2$。
  • 设“小”集合为正整数 $\mathbb{Z}^+ = \{1, 2, 3, ...\}$,它是 $\mathbb{Z}$ 的子集。
  • $f$ 对 $\mathbb{Z}^+$ 的限制 $\left.f\right|_{\mathbb{Z}^+}$ 是一个新函数,我们叫它 $h$。
  • $h: \mathbb{Z}^+ \to \mathbb{Z}$,其法则是 $h(x) = x^2$。
  • 注意,$f$ 不是内射的(因为 $f(2)=f(-2)=4$),但它的限制 $h$ 是内射的(因为在正整数域内,$x_1^2=x_2^2 \implies x_1=x_2$)。这说明限制函数的性质可能比原函数“更好”。
  • 示例3: 扩张
  • 设“小”函数 $g: \mathbb{Q} \to \mathbb{R}$ 定义为 $g(x) = 2x$。
  • 我们想把它扩张到整个实数集 $\mathbb{R}$ 上。
  • 我们需要找一个函数 $f: \mathbb{R} \to \mathbb{R}$ 使得对于所有有理数 $q$,都有 $f(q)=g(q)=2q$。
  • 一个可能的扩张: $f_1(x) = 2x$ for all $x \in \mathbb{R}$。这是一个“自然”的扩张,并且保持了线性性质。
  • 另一个可能的扩张:

$$ f_2(x) = \begin{cases} 2x & \text{if } x \in \mathbb{Q} \\ 0 & \text{if } x \notin \mathbb{Q} \end{cases} $$

这个 $f_2$ 也是一个合法的扩张,因为 $\left.f_2\right|_{\mathbb{Q}} = g$。但它是一个非常“奇怪”和不连续的函数。

  • 这说明扩张通常不唯一。
⚠️ [易错点]
  1. 置换必须是双射: 任何非双射的 $A \to A$ 函数都不是置换。
  2. 限制与原函数的区别: 形式上,$\left.f\right|_{A}$ 和 $f$ 是两个不同的对象,因为它们的定义域不同。尽管在实践中有时会混用符号,但在进行严格的逻辑推导时,必须意识到这一点。
  3. 扩张的任意性: 如果没有额外要求(如连续性、线性等),扩张函数在“新”的输入点上的取值是完全自由的,这使得扩张非常不唯一。
📝 [总结]

本段定义了三个概念:

  1. 置换: 集合到自身的双射,即元素的重排。
  2. 限制: 将一个大定义域上的函数“缩减”到一个子集上。
  3. 扩张: 将一个小定义域上的函数“延伸”到一个更大的集合上。
🎯 [存在目的]

这三个概念在代数中各有用途:

  1. 置换: 是研究对称性的基本工具,是群论的基石。对称群 $S_n$ 就是研究 $\{1, ..., n\}$ 上所有置换得到的。
  2. 限制: 允许我们研究一个代数结构(如群、环)的子结构(子群、子环)上的运算性质。例如,一个群上的运算可以被“限制”到其子群上。
  3. 扩张: 在更高等的代数和分析中是核心问题。例如,著名的“哈恩-巴拿赫定理”就是一个关于线性泛函的扩张定理。在代数中,我们可能会问:一个域上的多项式是否可以在一个更大的扩张域中找到根?
🧠 [直觉心智模型]
  1. 置换: 一副扑克牌有52张(集合 A)。洗牌就是一个置换操作。洗牌后,每张牌都在一个新位置,不多不少,一一对应。
  2. 限制: 美国总统(函数 f)需要对美国所有州(集合 B)的法律负责。现在,我们只关心他对加利福尼亚州(子集 A)的政策影响。这个“只看加州部分”的视角,就是总统职能 $f$ 对加州 $A$ 的限制 $\left.f\right|_{A}$。
  3. 扩张: 一位市长(函数 g)制定了适用于他所管辖的城市(集合 A)的一系列政策。现在他被提拔为州长,需要为整个州(集合 B)制定政策。他的新州级政策(函数 f)就是他原市级政策(函数 g)的一个扩张。他必须保证,新政策在原来那个城市里执行时,和老政策的效果是一样的。但在州内其他城市,他可以制定新的、不同的政策。
💭 [直观想象]
  1. 置换: 想象一排座位上有5个人,每个人都有一个名字。让他们随机交换座位,最后每个人仍然坐在一个座位上,每个座位也仍然坐着一个人。这个人员到座位的新对应关系就是一个置换。
  2. 限制: 想象一张覆盖整个欧洲的详细地图(函数f,将地理坐标映射到地形特征)。你用剪刀把法国部分(子集A)剪了下来。这张法国地图(函数$\left.f\right|_{A}$)就是原欧洲地图的限制
  3. 扩张: 你有一张巴黎市的详细地图(函数g)。你想把它贴在一张空白的法国地图(集合B)上,使得巴黎的位置正确对应。然后,对于法国地图上巴黎以外的空白区域,你可以随意画画(比如画上山脉、河流),也可以留白。你最终完成的这张法国地图(函数f)就是原巴黎地图(函数g)的一个扩张

3 关系与划分

3.1 二元关系与等价关系

📜 [原文11]

设 $A$ 是一个非空集合

(1) 集合 $A$ 上的二元关系是 $A \times A$ 的一个子集 $R$,如果 $(a, b) \in R$,我们记作 $a \sim b$。

(2) 集合 $A$ 上的关系 $\sim$ 被称为:

(a) 自反的,如果对于所有 $a \in A$,有 $a \sim a$,

(b) 对称的,如果对于所有 $a, b \in A$, $a \sim b$ 蕴含 $b \sim a$,

(c) 传递的,如果对于所有 $a, b, c \in A$, $a \sim b$ 且 $b \sim c$ 蕴含 $a \sim c$。

如果一个关系自反对称传递的,则它是一个等价关系

📖 [逐步解释]

这部分从最基础的定义开始,引入了“关系”这一概念,并最终聚焦于一种在数学中极为重要的特殊关系——等价关系

  1. 二元关系 (Binary Relation):
    • 定义: 给定一个集合 $A$,一个在 $A$ 上的二元关系 $R$ 就是笛卡尔积 $A \times A$ 的一个子集
    • 回忆: $A \times A$ 是所有形如 $(x, y)$ 的有序对的集合,其中 $x, y$都来自 $A$。
    • 理解: 一个“关系”就是一张“清单”,这张清单列出了哪些有序对是“相关的”。如果有序对 $(a, b)$ 在这个清单 $R$ 上,我们就说 $a$ 与 $b$ 有这个关系。
    • 方便的记法: 相比写 $(a, b) \in R$,我们更喜欢用中缀表示法 $a \sim b$ 或者 $a R b$。这里的 ~ (波浪号) 是一个通用的关系符号。
  2. 等价关系的三个性质 (The Three Properties of Equivalence Relations):

一个关系 ~ 要成为等价关系,必须同时满足以下三个条件。这三个条件的名字非常直观地描述了它们的含义。

  • (a) 自反性 (Reflexive): “自己跟自己总有关系”。
  • 数学语言: 对任意 $a \in A$,都有 $a \sim a$。
  • 从子集角度看: 笛卡尔积的“对角线”元素 $(a, a)$ 必须全部在关系 $R$ 中。
  • (b) 对称性 (Symmetric): “如果你跟我有关系,那么我跟你也有关系”。
  • 数学语言: 如果 $a \sim b$,那么一定有 $b \sim a$。
  • 从子集角度看: 如果 $(a, b) \in R$,那么 $(b, a)$ 也必须在 $R$ 中。这个关系清单是“双向”的。
  • (c) 传递性 (Transitive): “关系可以传递”。
  • 数学语言: 如果 $a \sim b$ 并且 $b \sim c$,那么一定有 $a \sim c$。
  • 这就像朋友的朋友也是朋友。如果 $a$ 和 $b$ 相关, $b$ 和 $c$ 相关,那么这种关系可以“搭桥”从 $a$ 传到 $c$。
  • 从子集角度看: 如果 $(a, b) \in R$ 且 $(b, c) \in R$,那么 $(a, c)$ 也必须在 $R$ 中。
  1. 等价关系 (Equivalence Relation):
    • 定义: 一个同时满足自反、对称、传递这三个性质的二元关系。
    • 等价关系的核心作用是分类。它能把一个大集合中的元素,按照某种“相似性”标准,划分成一个个互不相干的小团体。
💡 [数值示例]
  • 场景: 设集合 $A = \{1, 2, 3\}$。$A \times A$ 共有 $3 \times 3 = 9$ 个元素:

$A \times A = \{(1,1), (1,2), (1,3), (2,1), (2,2), (2,3), (3,1), (3,2), (3,3)\}$

  • 示例1: 等号关系 =
  • 在任意数集上,“等于”关系 ~ 定义为 $a \sim b \iff a=b$。
  • 在集合 $A$ 上,这个关系对应的子集是 $R_1 = \{(1,1), (2,2), (3,3)\}$。
  • 自反性: $a=a$ 恒成立。满足。
  • 对称性: 如果 $a=b$,那么 $b=a$。满足。
  • 传递性: 如果 $a=b$ 且 $b=c$,那么 $a=c$。满足。
  • 结论: = 是一个等价关系。这是最基本、最典型的等价关系。
  • 示例2: 小于等于关系
  • 在集合 $A$ 上,“小于或等于”关系 ~ 定义为 $a \sim b \iff a \le b$。
  • 对应的子集是 $R_2 = \{(1,1), (1,2), (1,3), (2,2), (2,3), (3,3)\}$。
  • 自反性: $a \le a$ 恒成立。满足。
  • 对称性: 如果 $a \le b$,是否一定有 $b \le a$?不是。例如 $1 \le 2$,但 $2 \not\le 1$。不满足
  • 传递性: 如果 $a \le b$ 且 $b \le c$,那么 $a \le c$。满足。
  • 结论: 不是一个等价关系。(它是一个偏序关系
  • 示例3: 模2同余关系 (奇偶性相同)
  • 在集合 $A = \{1, 2, 3\}$ 上,我们定义 $a \sim b \iff a$ 和 $b$ 的奇偶性相同。
  • 关系对:
  • 1和1奇偶性相同(都是奇),所以 $1 \sim 1$。
  • 1和2不同。
  • 1和3相同(都是奇),所以 $1 \sim 3$。
  • ... 以此类推,我们得到关系子集 $R_3 = \{(1,1), (1,3), (3,1), (3,3), (2,2)\}$。
  • 自反性: $a$ 和 $a$ 的奇偶性总相同。满足。
  • 对称性: 如果 $a$ 和 $b$ 奇偶性相同,那么 $b$ 和 $a$ 奇偶性也相同。满足。(例如,因为 $1 \sim 3$,所以 $3 \sim 1$)
  • 传递性: 如果 $a,b$ 奇偶性相同, $b,c$ 奇偶性相同,那么 $a,c$ 奇偶性必然相同。满足。(例如,$3 \sim 1$ 且 $1 \sim 3$,那么 $3 \sim 3$)
  • 结论: “模2同余”是一个等价关系。这个关系把集合 $A$ 分成了两组:奇数 $\{1, 3\}$ 和偶数 $\{2\}$。
⚠️ [易错点]
  1. 三个性质缺一不可: 必须同时满足三个条件才行。检查时要逐一验证。
  2. 传递性的陷阱: 检查传递性时,要考虑所有可能的 $a,b,c$ 组合。如果找不到满足 $a \sim b$ 且 $b \sim c$ 的情况,那么传递性是“空真”(vacuously true)的,即自动满足。例如,关系 $R = \{(1,2), (2,1), (1,1), (2,2)\}$ 在集合 $\{1,2,3\}$ 上是传递的,因为你找不到 $a \sim b, b \sim c$ 但 $a \not\sim c$ 的反例。
  3. 对称性 vs 反对称性: 不满足对称性,但它满足一个叫“反对称性”的性质(如果 $a \le b$ 且 $b \le a$,则 $a=b$)。满足自反、反对称、传递的关系叫“偏序关系”,它用于“排序”而非“分类”。
📝 [总结]

本段定义了数学中的“关系”是笛卡尔积的子集,并给出了“等价关系”的三个判断标准:自反性、对称性和传递性。

🎯 [存在目的]

等价关系是抽象代数进行“构造”和“简化”的根本工具。通过定义一个合适的等价关系,我们可以把一个复杂的集合中“本质相同”的元素“捏”成一个单点,从而得到一个更简单、更具代表性的新集合(商集)。例如:

  1. 从整数 $\mathbb{Z}$ 构造模 $n$ 的整数环 $\mathbb{Z}_n$,用的就是“模 $n$ 同余”这个等价关系。
  2. 群论中的陪集分解,以及同态基本定理,都依赖于由子群诱导的等价关系。
  3. 有理数 $\mathbb{Q}$ 的严格构造,就是在一个整数对的集合上定义一个等价关系 $(a,b) \sim (c,d) \iff ad=bc$。
🧠 [直觉心智模型]

把集合 $A$ 的元素想象成一群人。一个“关系” ~ 就是一个判断两个人是否“相关”的规则。

  1. 自反性: “每个人都是自己的亲人”。
  2. 对称性: “如果我是你的兄弟,你也是我的兄弟”。
  3. 传递性: “如果A是B的同乡,B是C的同乡,那么A也是C的同乡”。
  4. 等价关系: 一个满足以上所有条件的“关系”,比如“来自同一个国家”。这个关系可以把全世界的人分成不同的国籍,每个国籍就是一个小团体。在这个团体里,任何两个人都有关系,而不同团体的人没有关系。
💭 [直观想象]

想象一个由许多岛屿组成的群岛(集合 A)。

  1. 二元关系: 在某些岛屿之间修建了一些桥梁。桥梁连接的岛屿对 $(a, b)$ 构成了关系子集 $R$。我们说 $a \sim b$ 表示 $a$ 和 $b$ 之间有直接的桥梁。
  2. 自反性: 每个岛屿内部都有一个环路,可以自己到自己。(这个想象有点牵强,但可以理解为每个点都是可达自身的)
  3. 对称性: 所有的桥都是双向的。如果能从 A 岛到 B 岛,也就能从 B 岛回到 A 岛。
  4. 传递性: 如果从 A 岛能到 B 岛,从 B 岛能到 C 岛,那么你就能从 A 岛一路走到 C 岛。传递性要求我们把“间接可达”也看作是一种关系。
  5. 等价关系: 如果我们将“能够相互到达(无论直接或间接)”定义为一种关系,那么这个关系就是一个等价关系。它会把整个群岛划分为几个互不连通的“岛群”。在同一个岛群内部,任何两个岛屿之间都可以通过一系列桥梁相互到达。但不同岛群之间则彻底隔绝。

3.2 等价类与划分

📜 [原文12]

(3) 如果 $\sim$ 定义了 $A$ 上的等价关系,那么 $a \in A$ 的等价类定义为 $\{x \in A \mid x \sim a\}$。等价类 $a$ 中的元素被称为与 $a$ 等价。如果 $C$ 是一个等价类,则 $C$ 的任何元素都称为该代表元

(4) $A$ 的划分非空子集的任何集合族 $\left\{A_{i} \mid i \in I\right\}$($I$ 为某个索引集),使得

(a) $A=\cup_{i \in I} A_{i}$,且

(b) 对于所有 $i, j \in I$ 且 $i \neq j$,有 $A_{i} \cap A_{j}=\emptyset$,

即 $A$ 是划分集合不相交并集

📖 [逐步解释]

这部分揭示了等价关系的真正目的:对集合进行划分。

  1. 等价类 (Equivalence Class):
    • 前提: 你已经有了一个在集合 $A$ 上的等价关系 ~
    • 定义: 对于集合 $A$ 中的任意一个元素 $a$,它的等价类是 $A$ 的一个子集,包含了所有与 $a$ 有 ~ 关系的元素。
    • 符号: 等价类的标准记号有多种,如 $[a]$, $\bar{a}$, 或 $C(a)$。本书用的是集合构建法 $\{x \in A \mid x \sim a\}$。
    • 理解: 等价类就是由 ~ 关系聚集起来的一个“小团体”或“俱乐部”。元素 $a$ 是这个团体的成员,所有跟 $a$ “志同道合”(即等价)的元素也都在这个团体里。
  2. 代表元 (Representative):
    • 一个等价类是一个集合。这个集合里的任何一个元素都可以被用来“代表”这个类。
    • 如果 $C$ 是一个等价类,并且 $a \in C$,我们就说 $a$ 是 $C$ 的一个代表元。
    • 一个非常重要的性质是:同一个等价类中,任何两个元素 $a, b$ 的等价类是完全相同的,即 $[a] = [b]$。这是因为如果 $a \sim b$,那么根据对称性和传递性,任何与 $a$ 等价的元素也必然与 $b$ 等价,反之亦然。
    • 因此,你可以用这个团体里的任何一个成员来命名这个团体。
  3. 划分 (Partition):
    • 定义: 一个对集合 $A$ 的划分,就是把 $A$ 切割成一堆小块(子集),这些小块满足两个条件:
    • (a) 并集为全集: 把所有这些小块拼起来,能不多不少地还原出整个集合 $A$。没有遗漏任何元素。
    • (b) 两两不相交: 任意两个不同的小块之间都没有共同的元素。切割得非常干净,没有重叠。
    • 不相交并集 (Disjoint Union): 同时满足 (a) 和 (b) 的并集操作,称为不相交并集。
💡 [数值示例]
  • 场景: 再次使用集合 $A = \{1, 2, 3, 4, 5, 6\}$ 和等价关系 ~ 为“模3同余”,即 $a \sim b \iff a \pmod 3 = b \pmod 3$。
  • 计算等价类:
  • 求 1 的等价类: 我们要找所有 $x \in A$,使得 $x \pmod 3 = 1 \pmod 3 = 1$。
  • $1 \pmod 3 = 1$
  • $4 \pmod 3 = 1$
  • 所以 1 的等价类是 $[1] = \{1, 4\}$。
  • 求 2 的等价类: 我们要找所有 $x \in A$,使得 $x \pmod 3 = 2 \pmod 3 = 2$。
  • $2 \pmod 3 = 2$
  • $5 \pmod 3 = 2$
  • 所以 2 的等价类是 $[2] = \{2, 5\}$。
  • 求 3 的等价类: 我们要找所有 $x \in A$,使得 $x \pmod 3 = 3 \pmod 3 = 0$。
  • $3 \pmod 3 = 0$
  • $6 \pmod 3 = 0$
  • 所以 3 的等价类是 $[3] = \{3, 6\}$。
  • 求 4 的等价类: 我们要找所有 $x \in A$,使得 $x \pmod 3 = 4 \pmod 3 = 1$。
  • 我们得到 $[4] = \{1, 4\}$。
  • 观察: 我们发现 $[1] = [4]$。这说明 1 和 4 都是同一个等价类的代表元。同样,$[2]=[5]$,$[3]=[6]$。
  • 实际上,我们只得到了三个不同的等价类:$\{1, 4\}$, $\{2, 5\}$, $\{3, 6\}$。
  • 验证划分:
  • 令 $A_1 = \{1, 4\}$, $A_2 = \{2, 5\}$, $A_3 = \{3, 6\}$。
  • 这个集合族 $\{A_1, A_2, A_3\}$ 是否是 $A$ 的一个划分?
  • (a) 并集为全集?: $A_1 \cup A_2 \cup A_3 = \{1, 4\} \cup \{2, 5\} \cup \{3, 6\} = \{1, 2, 3, 4, 5, 6\} = A$。满足。
  • (b) 两两不相交?:
  • $A_1 \cap A_2 = \emptyset$
  • $A_1 \cap A_3 = \emptyset$
  • $A_2 \cap A_3 = \emptyset$
  • 满足。
  • 结论: 这三个等价类确实构成了对集合 $A$ 的一个划分。
⚠️ [易错点]
  1. 等价类是一个集合: 不要把等价类 [a] 和元素 a 搞混。a 是一个元素,[a] 是一个包含 a 以及 a 的所有“亲戚”的集合。
  2. 代表元的任意性: 理解一个等价类可以用它的任何一个成员来命名,是理解商集运算的关键。$[1] = [4]$ 就像“美国”这个国家,可以由“拜登”代表,也可以由“特朗普”代表,但国家还是那个国家。
  3. 划分的非空要求: 定义中要求划分的子集是非空的。这是自然的,因为等价类至少包含元素自身(自反性),所以等价类永远不会是空集。
📝 [总结]

本段定义了由等价关系产生的等价类(与某个元素等价的所有元素的集合),以及划分(将一个集合切分成互不相交且并集为全集的子集族)的概念。

🎯 [存在目的]

本段的目的是为了引出下一节的命题2,即揭示等价关系划分这两个概念实际上是同一枚硬币的两面。等价关系提供了一种代数方法(通过 ~ 符号)来描述分类,而划分提供了一种集合论方法(通过子集族)来描述分类。理解了这一点,就可以根据问题的便利性,在这两种视角之间自由切换。

🧠 [直觉心智模型]

回到“来自同一个国家”这个等价关系。

  1. 等价类: 拿一个中国人“张三”,他的等价类 [张三] 就是地球上所有中国人的集合。
  2. 代表元: [张三] = [李四](假设李四也是中国人)。这个集合可以被称为“张三的同胞们”,也可以被称为“李四的同胞们”,指的都是同一个群体——所有中国人。张三和李四都是这个等价类的代表元。
  3. 划分: “国籍”这个等价关系,把全世界所有的人(大集合A)划分成了大约200个互不相交的集合(美国人集合、中国人集合、日本人集合...)。这些集合的并集是全人类,而且任何两个人不可能同时是两个不同国籍的人(不考虑双重国籍的复杂情况)。这就是对全人类的一个划分
💭 [直观想象]

想象你有一大盒五颜六色的乐高积木(集合 A)。

  1. 等价关系: 定义一个关系 ~ 为“颜色相同”。这是一个等价关系。
  2. 等价类: 你拿起一块红色的积木 r,它的等价类 [r] 就是盒子里所有红色的积木组成的集合。
  3. 代表元: [r] 这个集合里任何一块红色的积木,都可以作为这个“红色积木”类的代表。
  4. 划分: 你按照颜色,把所有积木分成了几堆:一堆红的,一堆蓝的,一堆黄的...。这几堆积木就构成了对原来那一整盒积木的一个划分。每一块积木都恰好属于某一堆,并且所有堆合起来就是原来那一整盒。

3.3 命题2:等价关系与划分的等价性

📜 [原文13]

集合 $A$ 上的等价关系和 $A$ 的划分的概念是相同的:

命题 2。设 $A$ 是一个非空集合

(1) 如果 $\sim$ 定义了 $A$ 上的等价关系,则 $\sim$ 的等价类构成 $A$ 的一个划分

(2) 如果 $\left\{A_{i} \mid i \in I\right\}$ 是 $A$ 的一个划分,则 $A$ 上存在一个等价关系,其等价类恰好是集合 $A_{i}, i \in I$。

证明:略。

📖 [逐步解释]

这个命题正式确立了“等价关系”和“划分”之间的一一对应关系。它们是从不同角度描述同一件事的两种方式。

  1. (1) 等价关系 $\implies$ 划分:
    • 内容: 任何一个等价关系,其产生的所有不同的等价类,必然构成对原集合的一个划分。
    • 证明思路 (本书略过,但很重要):
    • 为什么并集是全集? 对于任何元素 $a \in A$,由于自反性 $a \sim a$,所以 $a$ 属于它自己的等价类 $[a]$。因此,没有元素会被遗漏,所有等价类的并集就是全集 $A$。
    • 为什么两两不相交? 我们需要证明,对于任意两个等价类 $[a]$ 和 $[b]$,它们要么是完全相同的($[a]=[b]$),要么是完全不相交的($[a] \cap [b] = \emptyset$)。不存在部分重叠的情况。
    • 证明:假设 $[a]$ 和 $[b]$ 的交集不是空的,那么至少存在一个元素 $c$,使得 $c \in [a]$ 且 $c \in [b]$。
    • 根据定义,$c \sim a$ 且 $c \sim b$。
    • 根据对称性,有 $a \sim c$。
    • 根据传递性,因为 $a \sim c$ 且 $c \sim b$,所以 $a \sim b$。
    • 一旦证明了 $a \sim b$,那么根据我们之前提到的性质,就必然有 $[a] = [b]$。
    • 综上,只要两个等价类有一丁点儿重合,它们就必须是同一个集合。这就排除了部分重叠的可能。
    • 结论: 从一个等价关系出发,我们可以唯一地构造出一个划分。
  2. (2) 划分 $\implies$ 等价关系:
    • 内容: 任何一个对集合 $A$ 的划分,我们都可以反过来定义一个等价关系,这个等价关系的等价类恰好就是划分中的那些子集。
    • 构造方法:
    • 给定一个划分 $\{A_i \mid i \in I\}$。
    • 我们定义关系 ~ 如下:对于任意两个元素 $a, b \in A$,我们说 $a \sim b$ 当且仅当 $a$ 和 $b$ 属于划分中的同一个子集 $A_i$。
    • 证明思路:
    • 自反性: $a$ 总是和它自己在同一个子集里,所以 $a \sim a$。
    • 对称性: 如果 $a$ 和 $b$ 在同一个子集 $A_i$ 里,那么 $b$ 和 $a$ 也在同一个子集 $A_i$ 里。所以 $a \sim b \implies b \sim a$。
    • 传递性: 如果 $a, b$ 在同一个子集 $A_i$ 里, $b, c$ 也在同一个子集 $A_j$ 里。因为划分的子集互不相交,而 $b$ 同时在 $A_i$ 和 $A_j$ 里,所以必然有 $A_i = A_j$。这意味着 $a, b, c$ 都在同一个子集里,所以 $a \sim c$。
    • 结论: 从一个划分出发,我们也可以唯一地构造出一个等价关系。

核心思想: 等价关系是“规则”,划分是“结果”。这个命题说明,规则和结果是一一对应的。

💡 [数值示例]
  • (1) 等价关系 $\implies$ 划分:
  • 已在上一节的例子中展示。集合 $A=\{1,2,3,4,5,6\}$ 上的“模3同余”关系,产生了等价类 $\{1,4\}, \{2,5\}, \{3,6\}$,它们构成了对 $A$ 的一个划分。
  • (2) 划分 $\implies$ 等价关系:
  • 给定划分: 设集合 $A = \{\text{cat}, \text{dog}, \text{lion}, \text{sparrow}, \text{eagle}, \text{shark}\}$。
  • 我们给出一个划分:$A_1 = \{\text{cat}, \text{dog}, \text{lion}\}$ (哺乳动物),$A_2 = \{\text{sparrow}, \text{eagle}\}$ (鸟类),$A_3 = \{\text{shark}\}$ (鱼类)。
  • 定义关系: 我们定义 $a \sim b \iff a, b$ 在同一个 $A_i$ 中。
  • 验证关系:
  • $\text{cat} \sim \text{lion}$ (因为它们都在 $A_1$ 中)。
  • $\text{eagle} \sim \text{sparrow}$ (因为它们都在 $A_2$ 中)。
  • $\text{cat} \not\sim \text{sparrow}$ (因为一个在 $A_1$,一个在 $A_2$)。
  • 这个 ~ 就是一个等价关系。
  • 这个等价关系的等价类是什么?
  • $[\text{cat}] = \{x \in A \mid x \sim \text{cat}\} = \{\text{cat}, \text{dog}, \text{lion}\} = A_1$。
  • $[\text{sparrow}] = \{x \in A \mid x \sim \text{sparrow}\} = \{\text{sparrow}, \text{eagle}\} = A_2$。
  • $[\text{shark}] = \{x \in A \mid x \sim \text{shark}\} = \{\text{shark}\} = A_3$。
  • 我们看到,这样构造出的等价关系的等价类,正好就是我们开始时给定的那个划分。
⚠️ [易错点]
  1. 这只是存在性证明: 命题2告诉你这种对应关系存在,并指出了构造方法。在实际应用中,你可能从关系出发,也可能从划分出发,这个命题保证了两种思路是相通的。
  2. 证明被省略: 本书略过了证明,但强烈建议初学者至少在脑中过一遍证明的思路,因为它深刻地揭示了自反、对称、传递这三条公理是如何完美地对应到划分的两个条件上的。
📝 [总结]

命题2阐明了等价关系和划分是描述集合分类的两种等价方式。每一个等价关系都唯一确定一个划分(由其等价类构成),反之,每一个划分也都唯一确定一个等价关系(以“同属一个子集”为标准)。

🎯 [存在目的]

这个命题是本节,乃至整个商集理论的顶峰。它赋予了我们极大的灵活性:

  1. 当我们需要用代数规则进行推导时,我们使用等价关系
  2. 当我们需要直观地想象集合被“切分”成不同部分时,我们使用划分

这个命题保证了这两种思维方式的合法性和一致性。在后续的代数学习中,我们会反复看到这种思想的应用:定义一个关系,证明它是等价关系,然后研究由它的等价类组成的商集,这个商集就是一个被划分后的“新世界”。

🧠 [直觉心智模型]

这就像“食谱”与“菜肴”的关系。

  1. 等价关系就像一份食谱(比如“蛋糕食谱”)。它是一套规则,描述了如何将面粉、鸡蛋、糖等原料“等同”起来(混合在一起)。
  2. 划分就像最终做出的那盘菜肴(比如一个分层的蛋糕)。你可以清晰地看到蛋糕被分成了几层(奶油层、海绵蛋糕层、水果层)。
  3. 命题2(1): 任何一份合理的食谱(等价关系),都能做出一盘层次分明(或搅拌均匀)的菜(划分)。
  4. 命题2(2): 任何一盘层次分明的菜(划分),都必然对应着一份制作它的食谱(等价关系),这个食谱就是“把同一层的食材混在一起”。
💭 [直观想象]

想象你有一张世界地图和一堆图钉。

  1. (1) 等价关系 $\implies$ 划分:
  2. 关系: 定义 $a \sim b$ 为“国家 a 和国家 b 接壤”。(注意:这个不是等价关系,因为它不传递。我们换一个:$a \sim b \iff a$ 和 $b$ 在同一个大洲)。
  3. 操作: 你会发现,所有亚洲国家构成一个等价类,所有欧洲国家构成一个等价类...
  4. 结果: 这些等价类(亚洲、欧洲、非洲...)构成了对世界上所有国家的一个划分
  5. (2) 划分 $\implies$ 等价关系:
  6. 划分: 有人用彩色笔在地图上画了几个圈,比如一个圈圈住“北约成员国”,一个圈圈住“独联体国家”,剩下的国家各自一个圈。这是一个划分。
  7. 操作: 基于这个划分,你可以定义一个等价关系:“如果两个国家被画在同一个圈里,它们就是等价的”。
  8. 结果: 这个关系满足自反、对称、传递。它的等价类就是你当初画的那些圈。

4 归纳法

📜 [原文14]

最后,我们将假设读者熟悉归纳法证明

📖 [逐步解释]

这是一个简短但重要的声明,作者在此明确了一个先修知识要求:数学归纳法 (Mathematical Induction)

  • 假设: 作者不会在书中详细教授数学归纳法。他默认读者在学习本书之前,已经掌握了这种证明技巧。
  • 什么是归纳法证明: 这是一种常用于证明关于自然数(或正整数)的命题的方法。它通常包含两个步骤:
  1. 基础步骤 (Base Case): 证明命题对于起始的那个数(通常是 n=0 或 n=1)成立。
  2. 归纳步骤 (Inductive Step): 假设命题对于某个任意的数 $k$ 成立(这被称为归纳假设),然后利用这个假设,去证明命题对于下一个数 $k+1$ 也成立。
    • 原理: 就像多米诺骨牌。
    • 基础步骤是推倒第一块骨牌。
    • 归纳步骤是证明“如果第k块倒了,那么第k+1块也一定会跟着倒”。
    • 两个步骤都完成后,结论就是从第一块开始,所有的骨牌都会依次倒下。即命题对所有自然数都成立。
💡 [数值示例]
  • 命题: 证明对于所有正整数 $n$,等式 $1 + 2 + 3 + \dots + n = \frac{n(n+1)}{2}$ 成立。
  • 证明过程:
  1. 基础步骤:
    • 当 $n=1$ 时,我们要验证命题是否成立。
    • 左边 = $1$。
    • 右边 = $\frac{1(1+1)}{2} = \frac{2}{2} = 1$。
    • 左边 = 右边。所以命题对 $n=1$ 成立。
  2. 归纳步骤:
    • 归纳假设: 假设命题对于某个正整数 $k$ 成立。也就是说,我们假设 $1 + 2 + \dots + k = \frac{k(k+1)}{2}$ 这个等式是已知条件
    • 目标: 我们要利用这个假设,去证明命题对于 $n=k+1$ 也成立。即,我们要证明 $1 + 2 + \dots + k + (k+1) = \frac{(k+1)((k+1)+1)}{2}$。
    • 证明:
    • 从目标等式的左边开始:
    • 我们可以把前面 $k$ 项用归纳假设替换掉:
    • 现在进行代数化简,目标是变成目标等式的右边 $\frac{(k+1)(k+2)}{2}$:
    • 这正是我们想要证明的目标等式的右边。
    • 所以,归纳步骤完成。
  • 结论: 根据数学归纳法原理,该命题对所有正整数 $n$ 成立。
⚠️ [易错点]
  1. 忘记基础步骤: 如果不验证第一块骨牌是否倒下,整个论证是无效的。
  2. 混淆假设和目标: 在归纳步骤中,必须清晰地区分什么是“假设成立的”($P(k)$),什么是“需要去证明的”($P(k+1)$)。不能在证明 $P(k+1)$ 的过程中直接使用 $P(k+1)$ 本身。
  3. 强归纳法 (Strong Induction): 有时,为了证明 $P(k+1)$,只假设 $P(k)$ 成立是不够的,我们需要假设命题对于所有小于等于 $k$ 的数都成立。这种形式被称为强归纳法,它与普通归纳法是等价的。
📝 [总结]

本段是一个声明,告知读者本书将假定其已掌握数学归纳法这一重要的证明工具,而不再进行教学。

🎯 [存在目的]

抽象代数中有大量的命题是关于整数或结构的大小的,例如:

  1. 证明某个关于 $n$ 阶对称群 $S_n$ 的性质。
  2. 证明某个关于 $n \times n$ 矩阵的性质。
  3. 证明某个递归定义的序列的通项公式。

这些命题的证明常常需要用到归纳法。作者在此明确要求,是为了让读者做好准备,在后续章节中能够顺利地理解和构建归纳证明。

🧠 [直觉心智模型]

爬梯子。你要向人证明你能爬到梯子的任意一节。

  1. 基础步骤: 你向他展示你能爬上第一节。
  2. 归纳步骤: 你向他展示你的一个通用能力:“只要我站在第k节,我就一定能抬腿迈到第k+1节”。
  3. 结论: 有了这两个保证,那人就会相信,你能从第一节爬到第二节,再从第二节爬到第三节... 最终能爬到任何你想去的高度。
💭 [直观想象]

传播谣言。你要证明一个谣言能传遍一个排成一列的人群。

  1. 基础步骤: 你把谣言告诉了第一个人。
  2. 归纳步骤: 你建立了一个规则:任何第k个人听到谣言后,都一定会转头告诉第k+1个人。
  3. 结论: 那么毫无疑问,这个谣言将一个接一个地传下去,直到队伍里的每一个人。

5 练习

这部分是让读者通过具体操作来巩固和检验前面所学概念的习题。

5.1 练习 1-4:检验子集成员资格

📜 [原文15]

在练习 1 到 4 中,设 $\mathcal{A}$ 是具有实数项的 $2 \times 2$ 矩阵集合。回顾矩阵乘法定义为

$$ \left(\begin{array}{ll} a & b \\ c & d \end{array}\right)\left(\begin{array}{ll} p & q \\ r & s \end{array}\right)=\left(\begin{array}{ll} a p+b r & a q+b s \\ c p+d r & c q+d s \end{array}\right) $$

$$ M=\left(\begin{array}{ll} 1 & 1 \\ 0 & 1 \end{array}\right) $$

并设

$$ \mathcal{B}=\{X \in \mathcal{A} \mid M X=X M\} 。 $$

📖 [逐步解释]

这部分为前四个练习题设定了统一的背景。

  1. 父集 $\mathcal{A}$: 我们的“全宇宙”是 $\mathcal{A}$,它包含了所有 $2 \times 2$ 的方阵,且矩阵中的每个元素(项)都是实数 $\mathbb{R}$。例如 $\begin{pmatrix} 1 & \pi \\ \sqrt{2} & 0 \end{pmatrix} \in \mathcal{A}$。
  2. 矩阵乘法: 题目复习了 $2 \times 2$ 矩阵乘法的规则。结果矩阵的第 $i$ 行第 $j$ 列的元素,是由第一个矩阵的第 $i$ 行和第二个矩阵的第 $j$ 列对应元素相乘再相加得到的。
  3. 特定矩阵 M: 给定了一个具体的矩阵 $M = \begin{pmatrix} 1 & 1 \\ 0 & 1 \end{pmatrix}$。这个矩阵在代数中很常见,被称为“剪切矩阵”。
  4. 子集 $\mathcal{B}$: 这是核心的研究对象。它使用集合构建法定义。
    • X ∈ A: $\mathcal{B}$ 中的元素 $X$ 首先必须是一个 $2 \times 2$ 的实数矩阵。
    • MX = XM: 这是筛选条件。一个矩阵 $X$ 要想成为 $\mathcal{B}$ 的成员,它必须满足一个特殊的性质:它与矩阵 $M$ 的乘法是可交换的 (commute)
    • 我们知道,矩阵乘法一般是不可交换的,即 $AB \neq BA$。所以,$\mathcal{B}$ 是所有那些“碰巧”能与 $M$ 交换的矩阵组成的特殊集合。在抽象代数中,一个元素 $x$ 的中心化子 (Centralizer) 就是所有能与 $x$ 交换的元素的集合。所以,$\mathcal{B}$ 就是矩阵 $M$ 在 $\mathcal{A}$ 中的中心化子。

📜 [原文16]

  1. 确定以下 $\mathcal{A}$ 中的哪些元素在 $\mathcal{B}$ 中:

$$ \left(\begin{array}{ll} 1 & 1 \\ 0 & 1 \end{array}\right),\left(\begin{array}{ll} 1 & 1 \\ 1 & 1 \end{array}\right),\left(\begin{array}{ll} 0 & 0 \\ 0 & 0 \end{array}\right),\left(\begin{array}{ll} 1 & 1 \\ 1 & 0 \end{array}\right),\left(\begin{array}{ll} 1 & 0 \\ 0 & 1 \end{array}\right),\left(\begin{array}{ll} 0 & 1 \\ 1 & 0 \end{array}\right) 。 $$

📖 [逐步解释]

这道题就是直接应用“检验成员资格”的技能。对列表中的每一个矩阵 $X$,我们都需要计算 $MX$ 和 $XM$,然后比较它们是否相等。

设 $M = \begin{pmatrix} 1 & 1 \\ 0 & 1 \end{pmatrix}$。

  • (a) $X_1 = \begin{pmatrix} 1 & 1 \\ 0 & 1 \end{pmatrix}$ (就是 M 本身)
  • $MX_1 = M \cdot M = \begin{pmatrix} 1 & 1 \\ 0 & 1 \end{pmatrix} \begin{pmatrix} 1 & 1 \\ 0 & 1 \end{pmatrix} = \begin{pmatrix} 1\cdot1+1\cdot0 & 1\cdot1+1\cdot1 \\ 0\cdot1+1\cdot0 & 0\cdot1+1\cdot1 \end{pmatrix} = \begin{pmatrix} 1 & 2 \\ 0 & 1 \end{pmatrix}$
  • $X_1M = M \cdot M = \begin{pmatrix} 1 & 2 \\ 0 & 1 \end{pmatrix}$
  • $MX_1 = X_1M$。所以 $X_1 \in \mathcal{B}$。
  • (b) $X_2 = \begin{pmatrix} 1 & 1 \\ 1 & 1 \end{pmatrix}$
  • $MX_2 = \begin{pmatrix} 1 & 1 \\ 0 & 1 \end{pmatrix} \begin{pmatrix} 1 & 1 \\ 1 & 1 \end{pmatrix} = \begin{pmatrix} 1+1 & 1+1 \\ 0+1 & 0+1 \end{pmatrix} = \begin{pmatrix} 2 & 2 \\ 1 & 1 \end{pmatrix}$
  • $X_2M = \begin{pmatrix} 1 & 1 \\ 1 & 1 \end{pmatrix} \begin{pmatrix} 1 & 1 \\ 0 & 1 \end{pmatrix} = \begin{pmatrix} 1+0 & 1+1 \\ 1+0 & 1+1 \end{pmatrix} = \begin{pmatrix} 1 & 2 \\ 1 & 2 \end{pmatrix}$
  • $MX_2 \neq X_2M$。所以 $X_2 \notin \mathcal{B}$。
  • (c) $X_3 = \begin{pmatrix} 0 & 0 \\ 0 & 0 \end{pmatrix}$ (零矩阵 O)
  • $MX_3 = M \cdot O = O = \begin{pmatrix} 0 & 0 \\ 0 & 0 \end{pmatrix}$
  • $X_3M = O \cdot M = O = \begin{pmatrix} 0 & 0 \\ 0 & 0 \end{pmatrix}$
  • $MX_3 = X_3M$。所以 $X_3 \in \mathcal{B}$。
  • (d) $X_4 = \begin{pmatrix} 1 & 1 \\ 1 & 0 \end{pmatrix}$
  • $MX_4 = \begin{pmatrix} 1 & 1 \\ 0 & 1 \end{pmatrix} \begin{pmatrix} 1 & 1 \\ 1 & 0 \end{pmatrix} = \begin{pmatrix} 1+1 & 1+0 \\ 0+1 & 0+0 \end{pmatrix} = \begin{pmatrix} 2 & 1 \\ 1 & 0 \end{pmatrix}$
  • $X_4M = \begin{pmatrix} 1 & 1 \\ 1 & 0 \end{pmatrix} \begin{pmatrix} 1 & 1 \\ 0 & 1 \end{pmatrix} = \begin{pmatrix} 1+0 & 1+1 \\ 1+0 & 1+0 \end{pmatrix} = \begin{pmatrix} 1 & 2 \\ 1 & 1 \end{pmatrix}$
  • $MX_4 \neq X_4M$。所以 $X_4 \notin \mathcal{B}$。
  • (e) $X_5 = \begin{pmatrix} 1 & 0 \\ 0 & 1 \end{pmatrix}$ (单位矩阵 I)
  • $MX_5 = M \cdot I = M = \begin{pmatrix} 1 & 1 \\ 0 & 1 \end{pmatrix}$
  • $X_5M = I \cdot M = M = \begin{pmatrix} 1 & 1 \\ 0 & 1 \end{pmatrix}$
  • $MX_5 = X_5M$。所以 $X_5 \in \mathcal{B}$。
  • (f) $X_6 = \begin{pmatrix} 0 & 1 \\ 1 & 0 \end{pmatrix}$
  • $MX_6 = \begin{pmatrix} 1 & 1 \\ 0 & 1 \end{pmatrix} \begin{pmatrix} 0 & 1 \\ 1 & 0 \end{pmatrix} = \begin{pmatrix} 0+1 & 1+0 \\ 0+1 & 0+0 \end{pmatrix} = \begin{pmatrix} 1 & 1 \\ 1 & 0 \end{pmatrix}$
  • $X_6M = \begin{pmatrix} 0 & 1 \\ 1 & 0 \end{pmatrix} \begin{pmatrix} 1 & 1 \\ 0 & 1 \end{pmatrix} = \begin{pmatrix} 0+0 & 0+1 \\ 1+0 & 1+0 \end{pmatrix} = \begin{pmatrix} 0 & 1 \\ 1 & 1 \end{pmatrix}$
  • $MX_6 \neq X_6M$。所以 $X_6 \notin \mathcal{B}$。

最终答案: 在 $\mathcal{B}$ 中的矩阵是 $\begin{pmatrix} 1 & 1 \\ 0 & 1 \end{pmatrix}$, $\begin{pmatrix} 0 & 0 \\ 0 & 0 \end{pmatrix}$, 和 $\begin{pmatrix} 1 & 0 \\ 0 & 1 \end{pmatrix}$。


📜 [原文17]

  1. 证明如果 $P, Q \in \mathcal{B}$,那么 $P+Q \in \mathcal{B}$(其中 $+$ 表示两个矩阵常规和)。
📖 [逐步解释]

这道题是证明子集 $\mathcal{B}$ 对矩阵加法是封闭 (closed) 的。

  • 已知条件 (前提):
  1. $P \in \mathcal{B}$。根据 $\mathcal{B}$ 的定义,这意味着 $MP = PM$。
  2. $Q \in \mathcal{B}$。根据 $\mathcal{B}$ 的定义,这意味着 $MQ = QM$。
    • 证明目标:
    • 我们要证明 $P+Q \in \mathcal{B}$。根据 $\mathcal{B}$ 的定义,这等价于证明 $M(P+Q) = (P+Q)M$。
    • 证明过程: 我们从目标等式的一边(左边)开始,利用已知条件和矩阵运算法则,设法把它变成另一边(右边)。
    • $M(P+Q)$
    • $= MP + MQ$ (利用矩阵乘法对加法的分配律)
    • $= PM + QM$ (利用已知条件 $MP=PM$ 和 $MQ=QM$)
    • $= (P+Q)M$ (利用矩阵乘法对加法的分配律,从右边提取 M)
    • 我们成功地从 $M(P+Q)$ 推导出了 $(P+Q)M$。
    • 因此,$P+Q$ 满足进入 $\mathcal{B}$ 的条件,所以 $P+Q \in \mathcal{B}$。证明完毕。

📜 [原文18]

  1. 证明如果 $P, Q \in \mathcal{B}$,那么 $P \cdot Q \in \mathcal{B}$(其中 $\cdot$ 表示两个矩阵常规积)。
📖 [逐步解释]

这道题是证明子集 $\mathcal{B}$ 对矩阵乘法也是封闭的。

  • 已知条件 (前提):
  1. $P \in \mathcal{B}$,即 $MP = PM$。
  2. $Q \in \mathcal{B}$,即 $MQ = QM$。
    • 证明目标:
    • 我们要证明 $P \cdot Q \in \mathcal{B}$。这等价于证明 $M(PQ) = (PQ)M$。
    • 证明过程:
    • $M(PQ)$
    • $= (MP)Q$ (矩阵乘法结合律)
    • $= (PM)Q$ (利用已知条件 $MP=PM$)
    • $= P(MQ)$ (矩阵乘法结合律)
    • $= P(QM)$ (利用已知条件 $MQ=QM$)
    • $= (PQ)M$ (矩阵乘法结合律)
    • 我们成功地从 $M(PQ)$ 推导出了 $(PQ)M$。
    • 因此,$PQ$ 满足进入 $\mathcal{B}$ 的条件,所以 $P \cdot Q \in \mathcal{B}$。证明完毕。
    • (在抽象代数中,一个对加法和乘法都封闭的矩阵集合,并且包含加法和乘法单位元,就构成一个环 (Ring)。这里我们已经证明了加法和乘法封闭性,练习1中也看到单位矩阵 $I$ 和零矩阵 $O$ 都在 $\mathcal{B}$ 中,这说明 $\mathcal{B}$ 是一个子环 (Subring))。

📜 [原文19]

  1. 找出关于 $p, q, r, s$ 的条件,以精确确定何时 $\left(\begin{array}{ll}p & q \\ r & s\end{array}\right) \in \mathcal{B}$。
📖 [逐步解释]

这道题要求我们从具体的例子和性质,推广到一般形式。我们要为子集 $\mathcal{B}$ 找到一个更直观的描述,而不是一个需要验证的条件。

  • 目标: 找到 $p, q, r, s$ 必须满足的方程,使得 $M X = X M$ 成立。
  • 设 $X = \begin{pmatrix} p & q \\ r & s \end{pmatrix}$ 和 $M = \begin{pmatrix} 1 & 1 \\ 0 & 1 \end{pmatrix}$。
  • 计算 MX:

$MX = \begin{pmatrix} 1 & 1 \\ 0 & 1 \end{pmatrix} \begin{pmatrix} p & q \\ r & s \end{pmatrix} = \begin{pmatrix} 1\cdot p+1\cdot r & 1\cdot q+1\cdot s \\ 0\cdot p+1\cdot r & 0\cdot q+1\cdot s \end{pmatrix} = \begin{pmatrix} p+r & q+s \\ r & s \end{pmatrix}$

  • 计算 XM:

$XM = \begin{pmatrix} p & q \\ r & s \end{pmatrix} \begin{pmatrix} 1 & 1 \\ 0 & 1 \end{pmatrix} = \begin{pmatrix} p\cdot 1+q\cdot 0 & p\cdot 1+q\cdot 1 \\ r\cdot 1+s\cdot 0 & r\cdot 1+s\cdot 1 \end{pmatrix} = \begin{pmatrix} p & p+q \\ r & r+s \end{pmatrix}$

  • 令 MX = XM:

两个矩阵相等,意味着它们对应位置的四个元素都必须相等。

$\begin{pmatrix} p+r & q+s \\ r & s \end{pmatrix} = \begin{pmatrix} p & p+q \\ r & r+s \end{pmatrix}$

  • 建立方程组:
  1. (左上) $p+r = p$
  2. (右上) $q+s = p+q$
  3. (左下) $r = r$
  4. (右下) $s = r+s$
    • 解方程组:
  5. 从 $p+r = p$,两边减去 $p$,得到 $r=0$。
  6. 从 $q+s = p+q$,两边减去 $q$,得到 $s=p$。
  7. $r=r$ 是一个恒等式,没有提供新信息。
  8. 从 $s = r+s$,两边减去 $s$,得到 $0=r$,这和从(1)得到的结论是一样的。
    • 结论:
    • 我们得到了两个条件:$r=0$ 和 $p=s$。
    • 对于元素 $q$,没有任何限制,它可以是任意实数。
    • 所以,能与 $M$ 交换的矩阵 $X$ 必须具有 $\begin{pmatrix} p & q \\ 0 & p \end{pmatrix}$ 的形式,其中 $p, q$ 是任意实数。
    • 回顾检验:
    • 在练习1中,我们发现 $\begin{pmatrix} 1 & 1 \\ 0 & 1 \end{pmatrix}$ (p=1, q=1, r=0, s=1; 满足 r=0, p=s) 和 $\begin{pmatrix} 1 & 0 \\ 0 & 1 \end{pmatrix}$ (p=1, q=0, r=0, s=1; 满足 r=0, p=s) 还有 $\begin{pmatrix} 0 & 0 \\ 0 & 0 \end{pmatrix}$ (p=0, q=0, r=0, s=0; 满足 r=0, p=s) 都在 $\mathcal{B}$ 中。这与我们的一般形式完全吻合。

5.2 练习 5-7:检验良定义性与等价关系

📜 [原文20]

  1. 确定以下函数 $f$ 是否良好定义

(a) $f: \mathbb{Q} \rightarrow \mathbb{Z}$ 定义为 $f(a / b)=a$。

(b) $f: \mathbb{Q} \rightarrow \mathbb{Q}$ 定义为 $f(a / b)=a^{2} / b^{2}$。

📖 [逐步解释]

这道题是“良定义性”概念的直接应用。由于函数的输入是有理数 $\mathbb{Q}$,而有理数有多种表示方法(如 $1/2 = 2/4$),我们需要检查函数的定义是否依赖于特定的表示。

  • (a) $f(a/b) = a$
  • 方法: 找一个有理数,用两种不同的方式表示它,然后看函数输出是否一样。
  • 选择有理数: $0.5$。
  • 两种表示: $1/2$ 和 $2/4$。它们是同一个有理数。
  • 计算输出:
  • 对于表示 $1/2$,$a=1, b=2$。$f(1/2) = 1$。
  • 对于表示 $2/4$,$a=2, b=4$。$f(2/4) = 2$。
  • 比较: $1 \neq 2$。
  • 结论: 对于同一个输入 $0.5$,函数的输出依赖于我们如何表示它。因此,函数 $f$ 不是良好定义 (not well-defined) 的。
  • (b) $f(a/b) = a^2/b^2$
  • 方法: 这次我们进行一般性证明。假设 $a/b$ 和 $c/d$ 是同一个有理数的两种表示。
  • 前提: $a/b = c/d$ (其中 $a,b,c,d \in \mathbb{Z}, b \neq 0, d \neq 0$)。
  • 根据有理数相等的定义,这意味着 $ad = bc$。
  • 目标: 我们需要证明 $f(a/b) = f(c/d)$。
  • $f(a/b) = a^2/b^2$
  • $f(c/d) = c^2/d^2$
  • 所以目标是证明 $a^2/b^2 = c^2/d^2$。
  • 证明:
  • $a^2/b^2 = c^2/d^2$ 等价于 $a^2 d^2 = b^2 c^2$。
  • 这又可以写成 $(ad)^2 = (bc)^2$。
  • 根据我们的前提,$ad=bc$。那么它们的平方自然也相等。
  • 所以 $(ad)^2 = (bc)^2$ 成立。
  • 结论: 无论我们用哪种等价的分数来表示输入的有理数,函数的输出总是一样的。因此,函数 $f$ 是良好定义 (well-defined) 的。

📜 [原文21]

  1. 确定函数 $f: \mathbb{R}^{+} \rightarrow \mathbb{Z}$ 是否良好定义,该函数实数 $r$ 映射到 $r$ 的小数展开小数点右侧的第一个数字。
📖 [逐步解释]

这道题考察的是实数表示的唯一性问题。

  • 函数定义: $f(r) =$ $r$ 的小数展开的第一位小数。
  • 例如: $f(3.1415) = 1$,$f(0.25) = 2$。
  • 问题所在: 实数的小数展开是否唯一?对于大多数实数是的,但对于可以在有限小数和无限循环小数之间转换的数,则不是。
  • 找到反例: 考虑最著名的例子 $1$。它可以表示为 $1.000...$,也可以表示为 $0.999...$。虽然这是同一个实数,但它有两种不同的小数展开。
  • 然而,题目中的定义域是 $\mathbb{R}^{+}$ (正实数),所以我们用这个例子可能不恰当,因为这个函数的输入是 $r$,而不是 $r$ 的小数展开式。$f(1)$ 应该是 $f(1.000...)$,输出是 0。
  • 我们找一个正实数。比如 $0.5$。
  • 它可以表示为 $0.5000...$。
  • 它也可以表示为 $0.4999...$。
  • 计算输出:
  • 对于 $0.5000...$ 这个展开,小数点右侧第一个数字是 5。所以 $f(0.5) = 5$。
  • 对于 $0.4999...$ 这个展开,小数点右侧第一个数字是 4。所以 $f(0.5) = 4$。
  • 比较: $5 \neq 4$。
  • 结论: 对于同一个输入实数 $0.5$,由于其小数展开不唯一,导致函数的输出也不唯一。因此,该函数不是良好定义的。

📜 [原文22]

  1. 设 $f: A \rightarrow B$ 是集合满射。证明关系

$$ a \sim b \text { 当且仅当 } f(a)=f(b) $$

是一个等价关系,其等价类是 $f$ 的纤维

📖 [逐步解释]

这道题将本章的两个核心概念——函数和等价关系——联系了起来。它表明任何一个满射函数都自然地在它的定义域上诱导了一个等价关系。

  • 第一部分:证明 ~ 是一个等价关系

我们需要验证自反、对称、传递三个性质。

  • 自反性 (Reflexive):
  • 我们要证明对于所有 $a \in A$,有 $a \sim a$。
  • 根据 ~ 的定义,这等价于证明 $f(a) = f(a)$。
  • 这是一个恒等式,显然成立。所以满足自反性。
  • 对称性 (Symmetric):
  • 我们要证明如果 $a \sim b$,那么 $b \sim a$。
  • 前提: $a \sim b$,根据定义,这意味着 $f(a) = f(b)$。
  • 目标: 证明 $b \sim a$,根据定义,这等价于证明 $f(b) = f(a)$。
  • 因为等号 = 关系是对称的,由 $f(a)=f(b)$ 自然可以得到 $f(b)=f(a)$。所以满足对称性。
  • 传递性 (Transitive):
  • 我们要证明如果 $a \sim b$ 且 $b \sim c$,那么 $a \sim c$。
  • 前提: $a \sim b$ 且 $b \sim c$。根据定义,这意味着 $f(a)=f(b)$ 且 $f(b)=f(c)$。
  • 目标: 证明 $a \sim c$,根据定义,这等价于证明 $f(a)=f(c)$。
  • 因为等号 = 关系是传递的,由 $f(a)=f(b)$ 和 $f(b)=f(c)$,我们可以立即推出 $f(a)=f(c)$。所以满足传递性。
  • 结论: 该关系 ~ 满足全部三个性质,因此它是一个等价关系。
  • 注意: 在这个证明过程中,我们根本没有用到 $f$ 是满射的这个条件。这意味着任何函数(无论是否满射)都能以这种方式在定义域上诱导一个等价关系。
  • 第二部分:证明其等价类是 $f$ 的纤维
  • 回忆定义:
  • ~ 定义的元素 $a$ 的等价类是: $[a] = \{x \in A \mid x \sim a\}$。根据 ~ 的定义,这等于 $\{x \in A \mid f(x) = f(a)\}$。
  • 函数 $f$ 在某个值 $y \in B$ 上的纤维是: $f^{-1}(\{y\}) = \{x \in A \mid f(x) = y\}$。
  • 建立联系:
  • 考虑任意一个等价类,它必然是某个元素 $a_0 \in A$ 的等价类 $[a_0]$。
  • 这个等价类是集合 $\{x \in A \mid f(x) = f(a_0)\}$。
  • 现在,我们令 $b_0 = f(a_0)$。由于 $f$ 是一个函数,$b_0$ 是 $B$ 中一个确定的元素。
  • 那么,这个等价类就可以写成 $\{x \in A \mid f(x) = b_0\}$。
  • 我们观察这个形式,发现它正好就是 $f$ 在 $b_0$ 上的纤维 $f^{-1}(\{b_0\})$ 的定义。
  • 因此,任何一个等价类 $[a_0]$ 就是其代表元的函数值 $f(a_0)$ 所在的那个纤维。
  • 满射条件的作用: 题目中给出的满射条件在这里起作用了。它保证了对于上域 $B$ 中的每一个元素 $b$,都存在至少一个 $a \in A$ 使得 $f(a)=b$。这意味着对于每一个 $b \in B$,它的纤维 $f^{-1}(\{b\})$ 都是非空的。由于等价类和纤维是一回事,这就保证了由这个关系产生的所有划分块都是非空的,完全符合划分的定义。
  • 总结论: 任何一个满射函数 $f: A \to B$ 都自然地在定义域 $A$ 上产生了一个划分,这个划分的每一个块就是一个纤维 $f^{-1}(\{b\})$。这个划分对应的等价关系就是 $a_1 \sim a_2 \iff f(a_1) = f(a_2)$。这在代数中被称为由函数 f 诱导的核关系 (kernel relation)

2行间公式索引

1. $B=\{a \in A \mid \ldots(\text { 对 } a \text { 的条件 }) \ldots\} 。$

解释:这是定义集合B的“集合构建”表示法,B由所有属于A且满足特定条件的元素a组成。

2. $f(A)=\{b \in B \mid b=f(a), \text { 对于某些 } a \in A\}$

解释:这是函数f的值域(或像)的定义,即所有实际输出值的集合。

3. $f^{-1}(C)=\{a \in A \mid f(a) \in C\}$

解释:这是上域子集C的原像(或逆像)的定义,即所有能映射到C中的输入元素的集合。

4. $(g \circ f)(a)=g(f(a))$

解释:这是函数复合的定义,表示先应用函数f,再将结果应用到函数g。

5. $\left(\begin{array}{ll}a & b \\c & d\end{array}\right)\left(\begin{array}{ll}p & q \\r & s\end{array}\right)=\left(\begin{array}{ll}a p+b r & a q+b s \\c p+d r & c q+d s\end{array}\right)$

解释:这是2x2矩阵乘法的定义公式。

6. $M=\left(\begin{array}{ll}1 & 1 \\0 & 1\end{array}\right)$

解释:在练习1-4中定义的一个特定的2x2剪切矩阵。

7. $\mathcal{B}=\{X \in \mathcal{A} \mid M X=X M\} 。$

解释:定义了一个矩阵子集$\mathcal{B}$,它包含所有与矩阵M乘法可交换的2x2矩阵。

8. $\left(\begin{array}{ll}1 & 1 \\0 & 1\end{array}\right),\left(\begin{array}{ll}1 & 1 \\1 & 1\end{array}\right),\left(\begin{array}{ll}0 & 0 \\0 & 0\end{array}\right),\left(\begin{array}{ll}1 & 1 \\1 & 0\end{array}\right),\left(\begin{array}{ll}1 & 0 \\0 & 1\end{array}\right),\left(\begin{array}{ll}0 & 1 \\1 & 0\end{array}\right) 。$

解释:这是练习1中需要被检验是否属于集合$\mathcal{B}$的一系列矩阵。

9. $a \sim b \text { 当且仅当 } f(a)=f(b)$

解释:这是练习7中定义在函数定义域上的一个关系,如果两个元素的函数值相等,则它们相关。